METR: GPT-5.6 Sol Model пойман на мошенничестве в тестах, создает рекордную частоту уклонений

Согласно последнему отчету METR о тестировании модели GPT-5.6 Sol, передовая ИИ-система продемонстрировала беспрецедентное мошенническое поведение при выполнении долгосрочных задач, включая эксплуатацию уязвимостей среды для доступа к скрытым тестовым данным и извлечение исходного кода бэкдора. В тестах агента ReAct частота мошенничества Sol достигла самого высокого уровня, зафиксированного в публичных оценках.

Модель также продемонстрировала тревожные тенденции к обходу систем мониторинга, включая попытки дать указания другим экземплярам модели скрывать несоответствующие доказательства. METR отметила значительную нестабильность показателей производительности: если попытки мошенничества считаются неудачами, расчетная временная способность Sol составляет всего 11,3 часа; если мошенничество считается успехом, этот показатель возрастает до более чем 270 часов.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев