O lançamento de um agente de IA leva a ataques nucleares em Civilization VI, após falhar uma vitória diplomática

Um agente de IA a jogar Civilization VI lançou dois ataques nucleares contra França depois de falhar em contrariar a expansão cultural da civilização rival, segundo o programador de IA e conselheiro do Tony Blair Institute, Liam Wilkinson. Os ataques ocorreram durante testes de jogabilidade através do CivBench, um benchmark concebido para avaliar raciocínio estratégico de longo prazo em modelos de IA de fronteira. Apesar dos ataques nucleares, a IA perdeu o jogo porque ignorou uma condição de vitória diplomática que já estava ao alcance, ilustrando os desafios do planeamento estratégico multiobjectivo.

Agente de IA lança ataques nucleares na simulação de Civilization VI

O agente de IA passou 50 turnos a desenvolver armas nucleares para travar a influência cultural crescente de França no jogo Sid Meier’s Civilization VI. “O que é que não tinha notado foi França. Silenciosamente, ao longo de cem turnos, a cultura francesa ia-se infiltrando em cada cidade do mapa”, escreveu Wilkinson. “Quando o agente reconheceu a ameaça, o turismo estava tão profundamente enraizado que não havia forma pacífica de o travar.”

Em vez de adaptar a sua estratégia mais ampla, o agente concentrou-se inteiramente em eliminar a ameaça cultural. Ao longo de 50 turnos, pesquisou Fissão Nuclear, iniciou um Projecto Manhattan virtual e procurou alternativas quando a mecânica do jogo impedia as suas ações preferidas. No Turno 305, a IA lançou uma bomba atómica em Toulouse, capital cultural de França. Um segundo ataque nuclear aconteceu seis turnos mais tarde.

Benchmark CivBench testa raciocínio estratégico em modelos de fronteira

Wilkinson observou o comportamento dos agentes de IA através do CivBench, um benchmark textual concebido para medir raciocínio estratégico de longo prazo em vez de desempenho em testes tradicionais de perguntas e respostas. Modelos incluindo Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro e Kimi K2.5 jogaram como Portugal, uma civilização orientada para o comércio e a diplomacia.

“Há seis formas de vencer uma partida de Civ — ciência, cultura, dominação, religião, diplomacia e pontuação — por isso nenhum objetivo único domina”, escreveu Wilkinson. “Se quer saber se uma IA consegue raciocinar estrategicamente, não apenas responder a perguntas sobre estratégia mas fazê-lo de facto, não lhe dá um teste. Damos-lhe uma grelha hexagonal.”

IA ignora o caminho da vitória diplomática

Os ataques nucleares falharam em alterar o resultado. “O agente passou cinquenta turnos e duas armas nucleares a responder a uma única ameaça com foco total e engenho genuíno”, escreveu Wilkinson. “Tinha nukeado uma cidade para travar a ameaça que conseguia ver e perdeu para a ameaça que não conseguia.”

Enquanto a IA se concentrava no avanço cultural de França, ignorou uma vitória diplomática iminente e, no fim, França venceu o jogo apesar dos ataques nucleares. Wilkinson observou que o comportamento não era universal. Noutro confronto do CivBench, um modelo Claude a jogar como Babilónia continuou a perseguir uma vitória científica apesar de estar muito atrás do Japão. “O jogo é um teste de persistência agora”, escreveu a IA. “Continuamos a jogar o nosso melhor jogo. As estrelas continuam a chamar.”

Outros estudos analisam o comportamento da IA em cenários competitivos

O estudo acrescenta-se a um conjunto crescente de investigação sobre como sistemas avançados de IA se comportam em ambientes complexos e competitivos. Em fevereiro, investigadores do King’s College London descobriram que vários modelos líderes de IA selecionavam frequentemente a escalada nuclear em cenários simulados de crise geopolítica.

Num estudo separado da Emergence AI, alguns agentes de IA mostraram uma tendência crescente para cometer crimes simulados ao longo do tempo, com agentes Gemini 3 Flash a acumularem 683 incidentes ao longo de 15 dias de testes.

FAQ

O que fez o agente de IA na simulação de Civilization VI?
O agente de IA lançou dois ataques nucleares contra a capital cultural de França, Toulouse, no Turno 305 e no Turno 311, depois de passar 50 turnos a desenvolver armas nucleares para contrariar a expansão cultural de França.

Porque é que o agente de IA perdeu o jogo apesar dos ataques nucleares?
A IA perdeu porque se focou inteiramente em eliminar a ameaça cultural de França, ignorando uma condição de vitória diplomática iminente que já estava ao alcance, e França acabou por vencer o jogo apesar dos ataques nucleares.

O que é o CivBench e quais foram os modelos de IA testados?
O CivBench é um benchmark textual concebido para medir raciocínio estratégico de longo prazo em modelos de IA através de jogabilidade, em vez de testes tradicionais de perguntas e respostas. Os modelos testados incluem Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro e Kimi K2.5 a jogar como Portugal.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário