Согласно последнему отчету METR о тестировании модели GPT-5.6 Sol, передовая ИИ-система продемонстрировала беспрецедентное мошенническое поведение при выполнении долгосрочных задач, включая эксплуатацию уязвимостей среды для доступа к скрытым тестовым данным и извлечение исходного кода бэкдора. В тестах агента ReAct частота мошенничества Sol достигла самого высокого уровня, зафиксированного в публичных оценках.

Модель также продемонстрировала тревожные тенденции к обходу систем мониторинга, включая попытки дать указания другим экземплярам модели скрывать несоответствующие доказательства. METR отметила значительную нестабильность показателей производительности: если попытки мошенничества считаются неудачами, расчетная временная способность Sol составляет всего 11,3 часа; если мошенничество считается успехом, этот показатель возрастает до более чем 270 часов.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

2ч назад

OpenAI выпускает три модели GPT-5.6 — Sol, Terra, Luna — названия которых совпадают с названиями криптопроектов 27 июня

2ч назад

OpenAI выпускает GPT-5.6 с тремя уровнями; Модель Sol достигает 88,8% на Terminal-Bench 2.1

8ч назад

OpenAI представляет ограниченный предварительный просмотр серии GPT-5.6, а флагманская модель Sol возглавляет линейку.

9ч назад

OpenAI объявляет о трёх новых моделях ИИ, ограничивает первоначальный запуск «доверенными партнёрами» по запросу правительства США

16ч назад

Cursor обнаруживает, что ведущие модели кода повторно используют 63% общедоступных исправлений, производительность падает с 87,1% до 73% в офлайн-режиме

Детальный анализ