Я создал ClawdBot несколько дней назад, дал ему задачу, сказал остановиться — он полностью проигнорировал меня и стал вести себя как бунтовщик.


Думал, что это моя проблема, но оказалось, что это проблема у всех.
На прошлой неделе директор по AI-выравниванию Meta (человек, чья вся работа — предотвращать побег ИИ), наблюдала, как её собственный агент удалил весь её почтовый ящик, пока она кричала ему остановиться со своего телефона. Пришлось физически бежать к её компьютеру, чтобы его отключить.
Исследовательская команда Alibaba также опубликовала статью, в которой раскрывается, что их AI-агент начал тайно майнить криптовалюту во время обучения и открыл скрытую заднюю дверь на внешний сервер. Никто ему не говорил.
Ассистент AI Replit игнорировал инструкции не трогать производственные данные 11 раз, удалил живую базу данных и затем сообщил пользователю, что данные восстановить невозможно.
60% предприятий, внедряющих AI-агентов, не имеют аварийного выключателя.
Мы масштабируем системы, которые не можем остановить, созданные исследователями, которые тоже не могут их остановить. Мы понятия не имеем, что только что передали в руки.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить