2026-05-29 17:32:16
Cinco modelos de IA de fronteira discordaram em 67% das alegações de checagem de fatos no estudo mais recente
De acordo com o pesquisador Kosta Jordanov, da Lenz Research, cinco modelos avançados de IA discordaram em 67% de 1.000 alegações reais de verificação de fatos testadas este mês. Os modelos — GPT-5.4, Claude Opus 4.7, Gemini 3 Pro, Gemini 3 Pro com Search e Sonar Pro — foram solicitados a classificar alegações como verdadeiras, em grande parte verdadeiras, enganosas ou falsas. Em 34% dos casos, a discordância foi acentuada, com um modelo chamando uma alegação de verdadeira enquanto outro a rotul