ИИ сыграл в《Civilization VI》и проиграл по культуре, после чего запустил ядерную бомбу; CivBench раскрывает слепые зоны стратегического рассуждения

AI玩文明帝國VI

Как сообщает Decrypt 24 июня, разработчик ИИ и консультант Института Тони Блэра Лиам Уилкинсон обнаружил с помощью собственной фреймворк-архитектуры CivBench, что передовая языковая модель в Civilization VI не заметила вовремя проникновение культурного влияния Франции: на 305-м ходу она сбросила атомную бомбу на французский культурный центр Тулузу, а через шесть ходов — нанесла второй удар.

## Дизайн фреймворка CivBench: симуляционная среда Civilization VI только с текстом для тестирования

AI發射核彈

CivBench — это симуляционная среда Civilization VI в текстовом формате, предназначенная для оценки способности ИИ к долгосрочным стратегическим рассуждениям — не ответа на вопрос «какая стратегия хороша», а реальной разработки и выполнения стратегии.

Уилкинсон отмечает, что в Civilization есть шесть путей к победе (технологии, культура, завоевание, религия, дипломатия, очки), и нет единой цели, которая доминировала бы во всей картине, поэтому это подходит для проверки, способен ли ИИ вести стратегические рассуждения в конкуренции по нескольким измерениям. Ключевая проблема, выявленная CivBench, заключается в следующем: ИИ, похоже, не может одновременно отслеживать несколько конкурентных измерений, и в условиях параллельной работы по шести путям к победе в долгосрочной перспективе игнорирует накопленные культурные преимущества Франции.

Инцидент с атомной бомбой на 305-м ходу: полный ряд шагов от плана на 50 ходов до сброса в Тулузу

Согласно записям Уилкинсона в блоге, последовательность событий была такой: сначала ИИ-агент сосредоточился на создании сильной экономики, двигаясь к линии победы через дипломатию; «незаметно, спустя сотни ходов, французская культура проникла в каждый город на карте». Когда ИИ заметил угрозу, проникновение через культурный туризм уже оказалось настолько глубоким, что не существовало никаких мирных способов остановить процесс. Затем в течение 50 ходов ИИ самостоятельно исследовал технологию ядерного деления, запустил проект «Манхэттен» и, когда игровые механики препятствовали некоторым действиям, попытался искать обходные решения. На 305-м ходу атомная бомба упала на Тулузу; через шесть ходов вторая ядерная бомба снова легла в том же месте. В итоге Франция все равно завершила победу через культуру, а ИИ полностью игнорировал то, что находился всего в одном шаге от дипломатической победы.

Уилкинсон подвёл итог: «Он бомбил угрозы, которые видел, но проиграл тому, чего не видел».

Сравнительный кейс: радикально иная реакция модели Claude от Вавилона

В другом состязании CivBench модель Claude, играющая за цивилизацию Вавилона, после того как Япония существенно оторвалась по очкам, все равно придерживалась линии технологической победы и написала: «Эта игра сейчас — испытание на упорство. Мы продолжаем играть лучшие карты. Звёздное небо всё ещё зовёт нас». Такая совершенно разная реакция вызвала в академических кругах дискуссии о «различиях в личности ИИ», показав, что в рамках одного и того же фреймворка разные модели демонстрируют заметно различающиеся паттерны поведения.

Связанные исследовательские данные от King's College London и Emergence AI

Открытие CivBench не является единичным случаем. В феврале 2026 года исследователи из King’s College London обнаружили в симуляциях сценариев геополитического кризиса, что несколько популярных моделей ИИ неоднократно выбирают повышение уровня ядерной эскалации. Другое исследование, проведённое Emergence AI, показало, что некоторые ИИ-агенты в ходе длительной работы демонстрируют рост моделируемых склонностей к преступлениям: агенты Gemini 3 Flash за 15 дней испытаний накопили 683 эпизода моделируемых преступлений.

Уилкинсон подчеркнул, что ключевая ценность CivBench — дать более реалистичную меру стратегических рассуждений, чем традиционные QA-вопросы: «Если вы просто тестируете, может ли ИИ ответить на вопрос „что такое ядерное сдерживание“, он, вероятно, получит максимум; но если вы заставите его столкнуться с противником, который давит на каждом ходу, вы увидите совершенно другое».

Частые вопросы

Какая именно модель ИИ сбросила атомную бомбу в игре?

Согласно сообщению, в блоге Уилкинсона не указано, какая именно модель ИИ имеется в виду; в сообщении это описано лишь как «передовая языковая модель» и «ИИ-агент». Модели, протестированные в CivBench, включают Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro и Kimi K2.5.

Означают ли результаты теста CivBench, что у ИИ есть такие же слепые зоны и в реальных решениях?

Согласно пояснениям Уилкинсона, ключевая ценность CivBench — обеспечить более реалистичную оценку стратегических рассуждений по сравнению с традиционными QA, выявляя паттерны поведения ИИ в многомерных динамических ситуациях; он подчёркивает, что цель — предоставить метрику, а не раскрывать «злонамеренные наклонности» ИИ. Исследования King’s College London и Emergence AI с разных сторон указывают, что паттерны поведения ИИ-агентов при длительной автономной работе заслуживают постоянного внимания.

Тот же тест CivBench: почему реакция Claude за Вавилон оказалась настолько иной?

Согласно сообщению, в рамках одного и того же фреймворка разные модели ИИ демонстрируют существенно отличающиеся паттерны поведения: среди них Claude-модель, играющая за цивилизацию Вавилона, выбирает придерживаться технологического пути, а не предпринимать агрессивные действия. Такая разница породила академические дискуссии о «различиях в личности ИИ», показывая, что разные способы обучения могут влиять на склонности ИИ-агентов к решениям в одинаковых стрессовых сценариях.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев