A Mini Max da China desafia novamente a guerra gerativa global com o modelo de IA 'M2.1'.

A startup chinesa de inteligência artificial MiniMax lançou um novo modelo de IA M2.1, desafiando novamente a competição global em IA generativa. Este modelo reforçou significativamente a diversidade das linguagens de programação e a capacidade de resposta a ambientes de trabalho reais, demonstrando melhorias abrangentes não apenas na assistência à codificação, mas também na redação de documentos e na resposta a diálogos.

A versão M2.1 lançada desta vez, através de uma atualização de desempenho que supera o modelo anterior M2, melhorou significativamente a compreensão e a precisão de geração para várias linguagens de programação. O suporte a linguagens foi expandido para Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript, entre outras, e sua capacidade de design e estética de interface do usuário nas plataformas Web, Android e iOS também recebeu avaliações significativamente melhoradas.

É especialmente notável que o M2.1 não apenas reforçou a correção da execução de códigos simples, mas também aumentou a capacidade de interpretar e seguir instruções de tarefas complexas ou guias detalhados, construindo assim uma IA mais alinhada com o ambiente de trabalho real. O MiniMax, para isso, melhorou a capacidade de diálogo e de redação de documentos do modelo, e demonstrou um desempenho excecional em uma ampla gama, desde diálogos cotidianos até a redação de documentos técnicos e respostas estruturadas.

O cofundador e CEO da plataforma de código aberto de agentes de IA Kilo Code, Scott Breitenother, afirmou: “Nos testes iniciais, o M2.1 demonstrou resultados excepcionais em todo o processo de desenvolvimento, incluindo design de arquitetura, orquestração de código, revisão e implantação”, e avaliou que o modelo atende simultaneamente à relação custo-benefício e alto desempenho.

Este modelo também é avaliado através de um novo indicador de referência chamado VIBE (Vision and Interactive Benchmark for Execution). O VIBE é construído com base em cinco áreas principais: Web, simulação, Android, iOS e desenvolvimento back-end, através de uma linguagem de validação baseada em agentes que realiza um julgamento abrangente da lógica interativa e dos elementos visuais dos resultados gerados. Segundo a MiniMax, o M2.1 obteve uma média de 88,6 pontos neste teste de referência, com pontuações excelentes de 91,5 pontos e 89,7 pontos nas áreas de Web e Android, respetivamente.

O M2.1 também foi comparado em termos de desempenho com modelos de IA de ponta. Nos resultados da avaliação comparativa com os principais modelos das principais empresas como Anthropic, Google, OpenAI e DeepSeek, o M2.1 demonstrou uma forte capacidade de resolução de problemas em testes de referência de alta dificuldade, como “Humanity’s Last Exam” e “Toolathon”. Especialmente, obteve 22.0 pontos no projeto HLE w/o Tools e 88 pontos no teste abrangente MMLU(Pro) nas áreas de humanidades, ciências e tecnologia, posicionando-se ao lado dos melhores modelos de IA.

M2.1 está atualmente disponível para download através da API própria da MiniMax ou do Hugging Face, e o serviço de representantes da empresa para a MiniMax também é baseado no M2.1. O lançamento deste modelo demonstra que o suporte à codificação multilingue e o mercado de agentes de IA estão evoluindo rapidamente, e também indica que a universalidade e a competitividade da IA generativa originada na China estão se expandindo continuamente.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)