Поддержать команду Зеркала
Беларусы на войне
  1. ВСУ нанесли удар по важнейшему для России заводу. Рассказываем, что он производит
  2. В измене государству обвинили трех минчан, которые проводили социсследования
  3. Погибший в Брестской районе при взрыве боеприпаса подросток совершил одну из самых распространенных ошибок. Что именно произошло
  4. «Мне отказано в назначении». Женщина проработала 30 лет, но осталась без трудовой пенсии — почему так произошло
  5. МВД изменило порядок сдачи экзаменов на водительские права. Что нового?
  6. Помните школьницу из Кобрина, победа которой на олимпиаде по немецкому возмутила некоторых беларусов? Узнали, что было дальше
  7. Умер беларусский актер и режиссер Максим Сохарь. Ему было 44 года
  8. Высокие чины тайно договаривались, как «удержать» цену на дорогой товар. Не вышло, Беларусь потеряла сотни миллионов долларов — рассказываем
  9. Хоккейное «Динамо-Минск» сотворило главную сенсацию в своей истории. Рассказываем, что произошло
  10. У культового американского музыканта, получившего Нобелевскую премию, нашли беларусские корни
  11. В сюжете госканала у политзаключенного была странная бирка на плече. Узнали, что это и для чего
  12. Первого убитого закопали в землю еще живым. Рассказываем о крупнейшей беларусской банде


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.