Avaliação independente mostra que o MiniMax M2.7 é comparável aos modelos de ponta de código fechado em tarefas de inteligência central

robot
Geração do resumo em andamento

Notícia ME, mensagem de 5 de abril (UTC+8). Recentemente, de acordo com a avaliação independente da LangChain, o modelo de pesos abertos MiniMax M2.7 atingiu um nível comparável ao de modelos de ponta fechados em tarefas fundamentais de agentes, como operações com ficheiros, chamadas de ferramentas e seguimento de instruções. Os pontos de vista no artigo afirmam que a sua vantagem reside em custos significativamente mais baixos, cerca de 20 vezes, e num aumento de velocidade de 2 a 4 vezes. Por exemplo, tomando como referência uma produção diária de 10 milhões de tokens, o custo de utilizar Opus 4.6 é de cerca de 250 dólares/dia, enquanto o MiniMax M2.7 exige apenas cerca de 12 dólares/dia. Este progresso deve-se ao impulso de benchmarks abertos, como SWE-Rebench e Terminal Bench 2.0, tornando os modelos abertos uma opção viável para implementar agentes em ambientes de produção e permitindo a sua utilização em conjunto com modelos fechados. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar