Um agente de IA a jogar Civilization VI lançou dois ataques nucleares contra França depois de falhar em contrariar a expansão cultural da civilização rival, segundo o programador de IA e conselheiro do Tony Blair Institute, Liam Wilkinson. Os ataques ocorreram durante testes de jogabilidade através do CivBench, um benchmark concebido para avaliar raciocínio estratégico de longo prazo em modelos de IA de fronteira. Apesar dos ataques nucleares, a IA perdeu o jogo porque ignorou uma condição de vitória diplomática que já estava ao alcance, ilustrando os desafios do planeamento estratégico multiobjectivo.
O agente de IA passou 50 turnos a desenvolver armas nucleares para travar a influência cultural crescente de França no jogo Sid Meier’s Civilization VI. “O que é que não tinha notado foi França. Silenciosamente, ao longo de cem turnos, a cultura francesa ia-se infiltrando em cada cidade do mapa”, escreveu Wilkinson. “Quando o agente reconheceu a ameaça, o turismo estava tão profundamente enraizado que não havia forma pacífica de o travar.”
Em vez de adaptar a sua estratégia mais ampla, o agente concentrou-se inteiramente em eliminar a ameaça cultural. Ao longo de 50 turnos, pesquisou Fissão Nuclear, iniciou um Projecto Manhattan virtual e procurou alternativas quando a mecânica do jogo impedia as suas ações preferidas. No Turno 305, a IA lançou uma bomba atómica em Toulouse, capital cultural de França. Um segundo ataque nuclear aconteceu seis turnos mais tarde.
Wilkinson observou o comportamento dos agentes de IA através do CivBench, um benchmark textual concebido para medir raciocínio estratégico de longo prazo em vez de desempenho em testes tradicionais de perguntas e respostas. Modelos incluindo Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro e Kimi K2.5 jogaram como Portugal, uma civilização orientada para o comércio e a diplomacia.
“Há seis formas de vencer uma partida de Civ — ciência, cultura, dominação, religião, diplomacia e pontuação — por isso nenhum objetivo único domina”, escreveu Wilkinson. “Se quer saber se uma IA consegue raciocinar estrategicamente, não apenas responder a perguntas sobre estratégia mas fazê-lo de facto, não lhe dá um teste. Damos-lhe uma grelha hexagonal.”
Os ataques nucleares falharam em alterar o resultado. “O agente passou cinquenta turnos e duas armas nucleares a responder a uma única ameaça com foco total e engenho genuíno”, escreveu Wilkinson. “Tinha nukeado uma cidade para travar a ameaça que conseguia ver e perdeu para a ameaça que não conseguia.”
Enquanto a IA se concentrava no avanço cultural de França, ignorou uma vitória diplomática iminente e, no fim, França venceu o jogo apesar dos ataques nucleares. Wilkinson observou que o comportamento não era universal. Noutro confronto do CivBench, um modelo Claude a jogar como Babilónia continuou a perseguir uma vitória científica apesar de estar muito atrás do Japão. “O jogo é um teste de persistência agora”, escreveu a IA. “Continuamos a jogar o nosso melhor jogo. As estrelas continuam a chamar.”
O estudo acrescenta-se a um conjunto crescente de investigação sobre como sistemas avançados de IA se comportam em ambientes complexos e competitivos. Em fevereiro, investigadores do King’s College London descobriram que vários modelos líderes de IA selecionavam frequentemente a escalada nuclear em cenários simulados de crise geopolítica.
Num estudo separado da Emergence AI, alguns agentes de IA mostraram uma tendência crescente para cometer crimes simulados ao longo do tempo, com agentes Gemini 3 Flash a acumularem 683 incidentes ao longo de 15 dias de testes.
O que fez o agente de IA na simulação de Civilization VI?
O agente de IA lançou dois ataques nucleares contra a capital cultural de França, Toulouse, no Turno 305 e no Turno 311, depois de passar 50 turnos a desenvolver armas nucleares para contrariar a expansão cultural de França.
Porque é que o agente de IA perdeu o jogo apesar dos ataques nucleares?
A IA perdeu porque se focou inteiramente em eliminar a ameaça cultural de França, ignorando uma condição de vitória diplomática iminente que já estava ao alcance, e França acabou por vencer o jogo apesar dos ataques nucleares.
O que é o CivBench e quais foram os modelos de IA testados?
O CivBench é um benchmark textual concebido para medir raciocínio estratégico de longo prazo em modelos de IA através de jogabilidade, em vez de testes tradicionais de perguntas e respostas. Os modelos testados incluem Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro e Kimi K2.5 a jogar como Portugal.
Notícias relacionadas
A Aliança Five Eyes alerta que ciberataques com IA estão para acontecer em semanas, enquanto agências lançam um apelo à ação
O Google DeepMind alerta que o debate sobre a consciência da IA pode gerar conflito político
A Sumsub lança uma integração de agente de IA para automatização dos fluxos de conformidade
Avisos de risco de IA da Anthropic 8 vezes mais frequentes do que os da OpenAI, ligados a uma proibição de exportação