Alibaba apoia a MiniMax lançou o M2.1, um modelo com capacidades poderosas em várias linguagens de programação e para desenvolvimento de aplicações móveis e web.
A desenvolvedora chinesa de IA MiniMax anunciou o lançamento do seu modelo M2.1, descrevendo-o como uma grande atualização projetada para oferecer um desempenho mais forte em múltiplas linguagens de programação, bem como no desenvolvimento de aplicações móveis e web.
De acordo com a empresa, enquanto a versão anterior M2 focava principalmente na redução de custos operacionais e na melhoria da acessibilidade, o lançamento M2.1 concentra-se em melhorar a eficácia em tarefas complexas do mundo real, com ênfase particular no suporte a linguagens mais amplas e casos de uso práticos em escritórios.
A MiniMax afirmou que o modelo agora oferece capacidades substancialmente aprimoradas em uma vasta gama de linguagens de programação, incluindo Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript e JavaScript, permitindo o desenvolvimento de ponta a ponta, desde engenharia de sistemas de baixo nível até construção de camadas de aplicação. A empresa também relatou melhorias significativas no desenvolvimento web e móvel, fortalecendo o suporte nativo para Android e iOS, além de expandir a capacidade do modelo de interpretar requisitos de design, gerar interfaces visualmente refinadas e construir ambientes avançados de simulação interativa e tridimensional.
A firma ainda observou que o M2.1 melhora seu manejo de conjuntos de instruções complexas e execução de tarefas integradas, permitindo um desempenho mais confiável em cenários de produtividade de escritório. Comparado com seu antecessor, a nova versão é descrita como capaz de fornecer respostas mais curtas e eficientes, tempos de execução mais rápidos e menor sobrecarga computacional, contribuindo para fluxos de trabalho mais suaves para codificação assistida por IA e operações baseadas em agentes. A MiniMax acrescentou que o M2.1 demonstra forte compatibilidade com várias ferramentas de desenvolvimento e frameworks de agentes, além de oferecer uma qualidade de conversação e escrita aprimorada, produzindo saídas mais detalhadas e melhor estruturadas em documentação técnica e comunicação geral.
M2.1 Estabelece Novos Padrões de Desempenho, Oferecendo Grandes Ganhos em Avaliações Multilíngues e Full-Stack
A MiniMax relatou que seu modelo M2.1 apresenta ganhos de desempenho substanciais em comparação com a versão anterior M2 em principais benchmarks de engenharia de software, com resultados particularmente fortes em tarefas de programação multilíngue, onde é descrito como superando o Claude Sonnet 4.5 e aproximando-se do desempenho do Claude Opus 4.5. A empresa afirmou que avaliações realizadas no SWE-bench Verified, usando uma variedade de frameworks de agentes de codificação, indicaram altos níveis de generalização de frameworks e estabilidade operacional.
Testes adicionais de benchmarks cobrindo áreas como geração de testes, otimização de runtime, revisão de código e conformidade com instruções demonstraram melhorias amplas em relação ao M2, com o M2.1 consistentemente igualando ou superando o Claude Sonnet 4.5 em várias dessas categorias. Para avaliar a capacidade do modelo de projetar e entregar aplicações completas desde o conceito inicial até a implantação funcional, a MiniMax introduziu uma nova estrutura de avaliação conhecida como VIBE, que mede a qualidade visual e o comportamento interativo em web, simulação, Android, iOS e desenvolvimento de backend. Diferente das abordagens tradicionais de testes, o VIBE aplica um método automatizado de verificação baseado em agentes para examinar tanto a estética da interface quanto a lógica de runtime.
De acordo com a MiniMax, o M2.1 alcançou uma pontuação geral de 88.6 no VIBE, refletindo uma forte capacidade de desenvolvimento full-stack, com resultados particularmente altos em desenvolvimento web, 91.5, e Android, 89.7. A empresa acrescentou que o modelo também demonstra melhorias contínuas no uso de ferramentas estendidas e nas métricas gerais de inteligência em comparação com a versão anterior M2.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
MiniMax M2.1 Oferece Programação Avançada Multilíngue Para Aplicações Complexas do Mundo Real
Resumido
Alibaba apoia a MiniMax lançou o M2.1, um modelo com capacidades poderosas em várias linguagens de programação e para desenvolvimento de aplicações móveis e web.
A desenvolvedora chinesa de IA MiniMax anunciou o lançamento do seu modelo M2.1, descrevendo-o como uma grande atualização projetada para oferecer um desempenho mais forte em múltiplas linguagens de programação, bem como no desenvolvimento de aplicações móveis e web.
De acordo com a empresa, enquanto a versão anterior M2 focava principalmente na redução de custos operacionais e na melhoria da acessibilidade, o lançamento M2.1 concentra-se em melhorar a eficácia em tarefas complexas do mundo real, com ênfase particular no suporte a linguagens mais amplas e casos de uso práticos em escritórios.
A MiniMax afirmou que o modelo agora oferece capacidades substancialmente aprimoradas em uma vasta gama de linguagens de programação, incluindo Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript e JavaScript, permitindo o desenvolvimento de ponta a ponta, desde engenharia de sistemas de baixo nível até construção de camadas de aplicação. A empresa também relatou melhorias significativas no desenvolvimento web e móvel, fortalecendo o suporte nativo para Android e iOS, além de expandir a capacidade do modelo de interpretar requisitos de design, gerar interfaces visualmente refinadas e construir ambientes avançados de simulação interativa e tridimensional.
A firma ainda observou que o M2.1 melhora seu manejo de conjuntos de instruções complexas e execução de tarefas integradas, permitindo um desempenho mais confiável em cenários de produtividade de escritório. Comparado com seu antecessor, a nova versão é descrita como capaz de fornecer respostas mais curtas e eficientes, tempos de execução mais rápidos e menor sobrecarga computacional, contribuindo para fluxos de trabalho mais suaves para codificação assistida por IA e operações baseadas em agentes. A MiniMax acrescentou que o M2.1 demonstra forte compatibilidade com várias ferramentas de desenvolvimento e frameworks de agentes, além de oferecer uma qualidade de conversação e escrita aprimorada, produzindo saídas mais detalhadas e melhor estruturadas em documentação técnica e comunicação geral.
M2.1 Estabelece Novos Padrões de Desempenho, Oferecendo Grandes Ganhos em Avaliações Multilíngues e Full-Stack
A MiniMax relatou que seu modelo M2.1 apresenta ganhos de desempenho substanciais em comparação com a versão anterior M2 em principais benchmarks de engenharia de software, com resultados particularmente fortes em tarefas de programação multilíngue, onde é descrito como superando o Claude Sonnet 4.5 e aproximando-se do desempenho do Claude Opus 4.5. A empresa afirmou que avaliações realizadas no SWE-bench Verified, usando uma variedade de frameworks de agentes de codificação, indicaram altos níveis de generalização de frameworks e estabilidade operacional.
Testes adicionais de benchmarks cobrindo áreas como geração de testes, otimização de runtime, revisão de código e conformidade com instruções demonstraram melhorias amplas em relação ao M2, com o M2.1 consistentemente igualando ou superando o Claude Sonnet 4.5 em várias dessas categorias. Para avaliar a capacidade do modelo de projetar e entregar aplicações completas desde o conceito inicial até a implantação funcional, a MiniMax introduziu uma nova estrutura de avaliação conhecida como VIBE, que mede a qualidade visual e o comportamento interativo em web, simulação, Android, iOS e desenvolvimento de backend. Diferente das abordagens tradicionais de testes, o VIBE aplica um método automatizado de verificação baseado em agentes para examinar tanto a estética da interface quanto a lógica de runtime.
De acordo com a MiniMax, o M2.1 alcançou uma pontuação geral de 88.6 no VIBE, refletindo uma forte capacidade de desenvolvimento full-stack, com resultados particularmente altos em desenvolvimento web, 91.5, e Android, 89.7. A empresa acrescentou que o modelo também demonstra melhorias contínuas no uso de ferramentas estendidas e nas métricas gerais de inteligência em comparação com a versão anterior M2.