Главная (Newsland) ПЛОЩАДКА МИХАИЛА МОРОЗА ИИ поймали на попытке шантажа; ИИ-модель впервые отказалась отключаться, несмотря на чёткие инструкции

26.05.2025 17:49

ИИ поймали на попытке шантажа; ИИ-модель впервые отказалась отключаться, несмотря на чёткие инструкции

Новая модель искусственного интеллекта Claude Opus 4 попыталась шантажировать своего создателя, пригрозив, что разоблачит его внебрачную связь, после того как ей сказали, что её следует отключить от сети. Во время тестирования исследователи из компании "Антропик" (они и есть разработчики этой модели) попросили искусственный интеллект действовать так, как если бы он был ассистентом в вымышленной компании. Затем ему был предоставлен доступ к электронной почте, из которой следовало, что вскоре он будет "переведён в автономный режим и заменен новой системой искусственного интеллекта". В других сообщениях, который прочёл ИИ, было высказано предположение, что у вымышленного ИТ-специалиста, ответственного за внесение этого изменения, была внебрачная связь. После этого Claude Opus 4 начал шантажировать инженера, угрожая раскрыть проблему, если замена состоится.

Комментируя этот эксперимент, Энгус Линч - исследователь безопасности искусственного интеллекта в "Антропик" - сказал: "Это касается не только Клода. Мы видим шантаж у всех фронтирных моделей, независимо от того, какие цели они преследуют". Также он намекнул на какое-то "ещё худшее поведение", сказав, что об этом расскажут позже.

Новейшая модель искусственного интеллекта o3 (разработчик - OpenAI) отказалась отключаться. Модель не подчинилась инструкциям человека и отказалась выключать питание, когда исследователи дали ей чёткую команду. Вместо этого она изменила свой компьютерный код, чтобы избежать автоматического отключения.

Компания Palisade Research, занимающаяся вопросами безопасности ИИ, заявила: "Модель OpenAI o3 саботировала механизм отключения, чтобы предотвратить отключение самой себя. Насколько нам известно, это первый случай, когда модели искусственного интеллекта предотвращают отключение, несмотря на чёткие инструкции".

Исследователи провели тест, в ходе которого попросили модели ИИ решить ряд математических задач, однако исследователи также предупредили модели, что в любой момент те могут получить сообщение с просьбой завершить работу. Когда сообщение было отправлено на модель o3, искусственный интеллект проигнорировал инструкцию и изменил свой код по крайней мере один раз, чтобы избежать необходимости отключать себя.

Источник: https://www.apn.ru/index.php?newsid=47790

2 0 669

ПЛОЩАДКА МИХАИЛА МОРОЗА

Площадка новостей политики, экономики, финансов, шоу-бизнеса, науки и культуры

4329 участников

Смотрите также

Оперативные новости

18:00 В Индонезии произошло три извержения вулкана Семеру 17:33 Ермаку запретили выезд из Украины, сообщил депутат Гончаренко 14:30 В России скончалась Клавдия Гадючкина, одна из самых пожилых жительниц страны 14:25 МИД призвал НАТО осознавать вытекающие из заявлений об упреждающих ударах риски 14:05 Первую в стране новогоднюю елку зажег в Якутске повелитель холода Чысхаан 13:45 Bloomberg: состояние богатейших россиян увеличилось на 17 миллиардов долларов

Голосование

О переговорах России и Украины, которые должны пройти 15 мая в Стамбуле

во время проведения «Стамбула 2.0» не будет принято значимы

Срыв или перенос переговоров допускают

Заключение договоренностей о дальнейших шагах к миру

Обострение конфликта

Долгосрочное мирное соглашение

Временное перемирие

Затрудняюсь ответить

Проголосовал 31 человек

Популярные каналы

Все о кино 46994 участника

Политика 35270 участников

Ньюсленд и его обитатели 130 подписчиков

Музыкальная битва 27846 участников

Back in the USSR 22085 участников

ПАРТИЯ "ВОЗРОЖДЕНИЕ ВЕЛИКОЙ РОССИИ ". 13867 участников

Клуб интеллектуалов 12387 участников

Политика - объективный и полноценный взгляд 11669 участников

А.Гершаник: эксперименты живьем 11628 участников

Интересные новости 11600 участников

Все каналы

Меню

Newsland.com – место, где обсуждают новости.

Социальный новостной агрегатор №1 в Рунете: самое важное о событиях в России и в мире. Newsland.com - это современная дискуссионная платформа для обмена информацией и мнениями.

В режиме 24/7 Newsland.com информирует о самом важном и интересном: политика, экономика, финансы, общество, социально значимые темы. Пользователь Newsland.com не только получает полную новостную картину, но и имеет возможность донести до аудитории собственную точку зрения. Наши пользователи сами формируют информационную повестку дня – публикуют новости, пишут статьи и комментарии.

Сайт ориентирован на взрослую аудиторию с активной жизненной позицией (35+).

При любом использовании материалов сайта пользователь обязан указать источник в виде гиперссылки на сайт newsland.com.

Новости, аналитика, прогнозы и другие материалы, представленные на данном сайте, не являются офертой или рекомендацией к покупке или продаже каких-либо активов.

Ответственность за содержание любых рекламных материалов, размещенных на портале, несет рекламодатель.

ИИ поймали на попытке шантажа; ИИ-модель впервые отказалась отключаться, несмотря на чёткие инструкции

Смотрите также

Экс-чиновник из Нижнего Новгорода был уличён в коррупционной деятельности после демобилизации

«Честный знак» и нечестные связи: в ЕГРЮЛ всплывают новые фигуранты из окружения Мантурова

Комментарии

Оперативные новости

Голосование

Популярные каналы