MiniMax M2.1 offre une programmation multilingue avancée pour des applications complexes du monde réel

En Bref

Alibaba soutient MiniMax a publié le M2.1, un modèle doté de capacités puissantes dans une variété de langages de programmation ainsi que pour le développement d’applications mobiles et web.

MiniMax Launches M2.1 Model With Advanced Multilingual And Full-Stack Development Capabilities

Le développeur chinois d’IA MiniMax a annoncé la sortie de son modèle M2.1, le décrivant comme une mise à niveau majeure conçue pour offrir de meilleures performances dans plusieurs langages de programmation ainsi que pour le développement d’applications mobiles et web.

Selon l’entreprise, alors que la version M2 précédente se concentrait principalement sur la réduction des coûts d’exploitation et l’amélioration de l’accessibilité, la version M2.1 vise à améliorer l’efficacité dans les tâches complexes du monde réel, avec un accent particulier sur un support linguistique plus large et des cas d’utilisation pratiques en bureautique.

MiniMax a déclaré que le modèle offre désormais des capacités nettement améliorées dans une large gamme de langages de programmation, notamment Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript et JavaScript, permettant un développement de bout en bout, de l’ingénierie système de bas niveau à la construction de couches applicatives. La société a également signalé d’importantes améliorations dans le développement web et mobile, renforçant le support natif pour Android et iOS tout en élargissant la capacité du modèle à interpréter les exigences de conception, à générer des interfaces visuellement raffinées et à construire des environnements interactifs avancés et de simulation en trois dimensions.

L’entreprise a en outre noté que le M2.1 améliore sa gestion des ensembles d’instructions complexes et l’exécution intégrée des tâches, permettant une performance plus fiable dans les scénarios de productivité bureautique. Par rapport à son prédécesseur, la nouvelle version est décrite comme fournissant des réponses plus courtes et plus efficaces, des temps d’exécution plus rapides et une surcharge computationnelle réduite, contribuant à des flux de travail plus fluides pour la programmation assistée par IA et les opérations basées sur des agents. MiniMax a ajouté que le M2.1 montre une forte compatibilité avec une variété d’outils de développement et de cadres d’agents, tout en offrant une qualité conversationnelle et rédactionnelle améliorée, produisant des résultats plus détaillés et mieux structurés dans la documentation technique et la communication générale.

M2.1 Fixe de Nouveaux Référentiels de Performance, Réalisant d’Importants Gains dans les Évaluations Multilingues et Full-Stack

MiniMax a rapporté que son modèle M2.1 montre des gains de performance substantiels par rapport à la version M2 précédente dans les principaux benchmarks d’ingénierie logicielle, avec des résultats particulièrement solides dans les tâches de programmation multilingue, où il est décrit comme surpassant Claude Sonnet 4.5 et approchant la performance de Claude Opus 4.5. La société a indiqué que les évaluations menées sur SWE-bench Verified, utilisant une gamme de cadres d’agents de codage, ont montré des niveaux élevés de généralisation des cadres et de stabilité opérationnelle.

Des tests de référence supplémentaires couvrant des domaines tels que la génération de tests, l’optimisation en temps d’exécution, la revue de code et la conformité aux instructions ont apparemment démontré des améliorations générales par rapport à M2, M2.1 étant systématiquement au niveau ou surpassant Claude Sonnet 4.5 dans plusieurs de ces catégories. Pour évaluer la capacité du modèle à concevoir et livrer des applications complètes depuis le concept initial jusqu’au déploiement fonctionnel, MiniMax a introduit un nouveau cadre d’évaluation appelé VIBE, qui mesure la qualité visuelle et le comportement interactif à travers le web, la simulation, Android, iOS et le développement backend. Contrairement aux approches de test traditionnelles, VIBE applique une méthode de vérification automatisée basée sur des agents pour examiner à la fois l’esthétique de l’interface et la logique d’exécution.

Selon MiniMax, le M2.1 a obtenu un score VIBE global de 88.6, reflétant une forte capacité de développement full-stack, avec des résultats particulièrement élevés dans le développement web à 91.5 et Android à 89.7. La société a ajouté que le modèle montre également des améliorations continues dans l’utilisation d’outils étendus et dans les métriques d’intelligence globale par rapport à la version M2 précédente.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)