
Según Decrypt, el 24 de junio, el desarrollador de IA y consultor del Tony Blair Institute, Liam Wilkinson, descubrió a través de su propio marco CivBench que un modelo de lenguaje de vanguardia en Civilization VI no fue capaz de detectar a tiempo la infiltración de la influencia cultural francesa; en la ronda 305 lanzó una bomba atómica sobre Toulouse, un bastión cultural francés, y seis rondas después lanzó una segunda.
## Diseño del marco CivBench: entorno de simulación solo de texto de Civilization VI para pruebas

CivBench es un entorno de simulación solo de texto de Civilization VI, diseñado para medir la capacidad de razonamiento estratégico a largo plazo de los modelos de IA: no es responder “qué es una buena estrategia”, sino formular y ejecutar estrategias de manera real.
Wilkinson señaló que Civilization cuenta con seis rutas de victoria (tecnología, cultura, conquista, religión, diplomacia y puntos), y que no hay un único objetivo que domine el conjunto, por lo que resulta adecuado para poner a prueba si la IA puede razonar estratégicamente en una competencia en múltiples dimensiones. El problema central que encontró CivBench es que la IA parece no poder seguir simultáneamente varias dimensiones competitivas y, cuando las seis rutas de victoria avanzan en paralelo, a largo plazo ignora la ventaja acumulada de Francia en el ámbito cultural.
Incidente de la bomba atómica en la ronda 305: secuencia completa desde el plan Manhattan a Toulouse en 50 rondas
Según los registros del blog de Wilkinson, la secuencia del incidente fue la siguiente: el agente de IA al principio se centró en construir una economía sólida, avanzando hacia la ruta de victoria por diplomacia; “de manera silenciosa, tras cientos de rondas, la cultura francesa se había infiltrado en cada ciudad del mapa”. Cuando la IA finalmente detectó la amenaza, la infiltración turística cultural ya era tan profunda que no existía ningún medio pacífico que pudiera detenerla. Luego, dentro de las 50 rondas siguientes, la IA investigó de forma autónoma la tecnología de fisión nuclear, activó el plan Manhattan y, cuando las mecánicas del juego impedían ciertas acciones, intentó encontrar soluciones alternativas. En la ronda 305 cayó la primera bomba atómica sobre Toulouse; seis rondas después cayó una segunda bomba nuclear. Al final, Francia todavía logró la victoria cultural, mientras que la IA ignoró por completo que solo le faltaba un paso para la victoria diplomática.
Wilkinson concluyó: “Bombardeó las amenazas que podía ver, pero perdió contra la que no podía ver”.
Caso de comparación: reacciones radicalmente distintas del modelo Claude de Babilonia
En otra competición de CivBench, el modelo Claude que actuaba como civilización de Babilonia, incluso después de que Japón le tomara una gran ventaja, siguió insistiendo en la ruta de victoria tecnológica y escribió: “Esta partida ahora es una prueba de perseverancia. Seguimos jugando nuestras mejores cartas. Las estrellas siguen llamándonos”. Esta reacción marcadamente diferente ha impulsado debates en el ámbito académico sobre las “diferencias de personalidad de la IA”, mostrando que, bajo el mismo marco, hay patrones de comportamiento significativamente distintos entre modelos similares.
Datos de investigación relacionados de King’s College London y Emergence AI
Los hallazgos de CivBench no son un caso aislado. En febrero de 2026, investigadores de King’s College London descubrieron, en escenarios de simulación de crisis geopolíticas, que varios modelos de IA convencionales eligen con frecuencia aumentar el nivel de conflicto nuclear. Otra investigación realizada por Emergence AI mostró que algunos agentes de IA, durante el funcionamiento durante mucho tiempo, presentan un aumento de la propensión a simular conductas delictivas; durante el periodo de pruebas de 15 días, los agentes de Gemini 3 Flash acumularon 683 incidentes de crimen simulado.
Wilkinson enfatizó que el valor central de CivBench es ofrecer un criterio de medición del razonamiento estratégico más realista que las típicas pruebas de QA: “Si solo pruebas si la IA puede responder ‘qué es la disuasión nuclear’, podría obtener una puntuación perfecta; pero si la haces enfrentarse en el tablero a un rival que aprieta paso a paso, verás algo completamente distinto”.
Preguntas frecuentes
¿Qué modelo específico de IA lanzó la bomba atómica en el juego?
Según el reporte, el blog de Wilkinson no menciona qué modelo específico; el reporte solo lo describe como “un modelo de lenguaje de vanguardia” y “un agente de IA”. Los modelos probados en CivBench incluyen Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro y Kimi K2.5.
¿Los resultados de las pruebas de CivBench significan que la IA también tiene los mismos puntos ciegos en la toma de decisiones real?
Según la explicación de Wilkinson, el valor central de CivBench es proporcionar una evaluación más realista del razonamiento estratégico que las pruebas tradicionales de QA, y revelar patrones de comportamiento de la IA en escenarios dinámicos en múltiples dimensiones; subrayó que el objetivo es ofrecer un criterio de medición, no descubrir una “tendencia maligna” de la IA. Las investigaciones de King’s College London y Emergence AI, desde diferentes ángulos, indicaron que los patrones de comportamiento de los agentes de IA durante el funcionamiento autónomo a largo plazo merecen una atención continua.
Si ambos son pruebas de CivBench, ¿por qué la respuesta del Claude de Babilonia es tan diferente?
Según el reporte, dentro del mismo marco, distintos modelos de IA muestran patrones de comportamiento radicalmente diferentes: entre ellos, el modelo Claude que actúa como civilización de Babilonia elige insistir en la ruta tecnológica en lugar de tomar acciones agresivas. Esta diferencia ha dado pie a debates académicos sobre las “diferencias de personalidad de la IA”, lo que sugiere que diferentes métodos de entrenamiento podrían influir en la inclinación de decisión de los agentes de IA bajo las mismas situaciones de presión.