Os resultados do desempenho excepcional do Gemini 3 Flash no modelo OpenClaw foram partilhados

robot
Geração de resumo em curso

Os fundadores do OpenClaw, Peter Steinberger, compartilharam recentemente notícias importantes que se tornaram o centro das atenções na indústria de IA. Eles divulgaram informações detalhadas sobre o desempenho do seu sistema de IA através de uma entidade independente de terceiros, a PinchBench.

Resultados apresentados pela PinchBench

De acordo com o relatório da 1M AI News, a PinchBench é uma organização independente que analisa o desempenho de vários grandes modelos de linguagem (LLMs). Nesta última avaliação, foi comparado o desempenho de todos os principais modelos de IA envolvidos nas tarefas do agente OpenClaw.

Os resultados partilhados pela PinchBench são bastante encorajadores. Na avaliação, o Gemini 3 Flash, um dos modelos mais recentes do Google, obteve uma taxa de sucesso de 95,1% e ficou em primeiro lugar.

Diferenças de desempenho entre os modelos

Em segundo lugar, está o modelo minimax-m2.1, desenvolvido pela Minimax, que alcançou uma taxa de sucesso de 93,6%. Em terceiro lugar, ficou o modelo kimi-k2.5 da Moonshot AI, com uma taxa de sucesso de 93,4%.

O desempenho de outros modelos conhecidos também é digno de nota. O modelo Claude Sonnet 4.5 da Anthropic obteve uma taxa de sucesso de 92,7%, ficando em quarto lugar. O modelo GPT-4o da OpenAI, bastante popular, ficou em quinto lugar com uma taxa de 85,2%.

Estes resultados demonstram que ainda há bastante espaço para melhorias nos diferentes modelos de IA em tarefas específicas, e que cada modelo possui suas próprias forças para alcançar os objetivos do OpenClaw.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar