Поддержать команду Зеркала
Беларусы на войне
  1. «Сейчас меня в лес вывезут, расстреляют и закопают». Интервью с экс-политзаключенной, которую заставили покинуть Беларусь
  2. Источник «Зеркала»: Директора РНПЦ «Кардиология» хотят уволить с должности. Рассказываем, что удалось узнать
  3. «Мои родители беларусы. Да и я сам беларус». Поговорили с гражданином США, которого дипломаты вытаскивали из СИЗО
  4. В Европе однажды уже пытались умиротворить агрессора, предложив ему часть территории жертвы. Вот как это было и чем закончилось
  5. Власти утвердили документ, который способен вызвать вопросы у населения из-за наличия в стране АЭС
  6. Кажется, США хотят бросить союзников по НАТО без защиты. Но у них перед Европой и юридический, и моральный долг — рассказываем
  7. Этим летом введут еще одно пенсионное изменение. В Минтруда рассказали, для чего придумали новшество
  8. Банки вводят изменения по переводам
  9. Один из банков вводит комиссию по валютным счетам. Для некоторых клиентов она будет составлять 12 000 рублей в месяц (и это не опечатка)
  10. Верховный суд: Несколько десятков тысяч приговоров могут пересмотреть в Беларуси
  11. Трамп назвал Зеленского «диктатором», который втянул США в войну
  12. Вы наверняка слышали о дефиците кадров в стране. Вот наглядный пример, как эта проблема уже негативно влияет на работу одной из отраслей
  13. Лукашенко озадачился работой Wildberries — вызывал к себе владелицу маркетплейса. Результат встречи не заставил себя долго ждать
  14. Эксперты рассказали, как в России формировали делегацию на переговоры, чтобы получить максимальные уступки от Соединенных Штатов
  15. «Вы могли бы заключить сделку»: Трамп обрушился на Украину после переговоров США и России


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.