Alibaba respaldó MiniMax lanzó M2.1, un modelo con capacidades potentes en una variedad de lenguajes de programación y para el desarrollo de aplicaciones móviles y web.
El desarrollador chino de IA MiniMax informó del lanzamiento de su modelo M2.1, describiéndolo como una gran actualización diseñada para ofrecer un rendimiento más fuerte en múltiples lenguajes de programación, así como en el desarrollo de aplicaciones móviles y web.
Según la compañía, mientras que la versión anterior M2 se centraba principalmente en reducir costos operativos y mejorar la accesibilidad, la versión M2.1 se enfoca en mejorar la eficacia en tareas complejas del mundo real, con énfasis particular en un soporte más amplio de idiomas y casos prácticos de uso en oficina.
MiniMax afirmó que el modelo ahora ofrece capacidades sustancialmente mejoradas en una amplia gama de lenguajes de programación, incluyendo Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript y JavaScript, permitiendo un desarrollo de extremo a extremo desde la ingeniería de sistemas de bajo nivel hasta la construcción en la capa de aplicación. La compañía también reportó mejoras importantes en el desarrollo web y móvil, fortaleciendo el soporte nativo para Android y iOS, además de ampliar la capacidad del modelo para interpretar requisitos de diseño, generar interfaces visualmente refinadas y construir entornos interactivos avanzados y simulaciones tridimensionales.
La firma además señaló que M2.1 mejora su manejo de conjuntos de instrucciones complejas y la ejecución de tareas integradas, permitiendo un rendimiento más confiable en escenarios de productividad de oficina. En comparación con su predecesor, la nueva versión se describe como capaz de entregar respuestas más cortas y eficientes, tiempos de ejecución más rápidos y menor carga computacional, contribuyendo a flujos de trabajo más suaves para codificación asistida por IA y operaciones basadas en agentes. MiniMax añadió que M2.1 demuestra una fuerte compatibilidad con una variedad de herramientas de desarrollo y marcos de agentes, además de ofrecer una mejor calidad en conversaciones y escritura, produciendo resultados más detallados y mejor estructurados en documentación técnica y contextos de comunicación general.
M2.1 Establece Nuevos Referentes de Rendimiento, Logrando Grandes Mejoras en Evaluaciones Multilingües y Full-Stack
MiniMax informó que su modelo M2.1 muestra ganancias sustanciales en rendimiento en comparación con la versión anterior M2 en los principales benchmarks de ingeniería de software, con resultados particularmente fuertes en tareas de programación multilingüe, donde se le describe como superando a Claude Sonnet 4.5 y acercándose al rendimiento de Claude Opus 4.5. La compañía afirmó que las evaluaciones realizadas en SWE-bench Verified, usando una variedad de marcos de agentes de codificación, indicaron altos niveles de generalización del marco y estabilidad operativa.
Pruebas adicionales de benchmarks que cubren áreas como generación de pruebas, optimización en tiempo de ejecución, revisión de código y cumplimiento de instrucciones, demostraron mejoras amplias respecto a M2, con M2.1 consistentemente igualando o superando a Claude Sonnet 4.5 en varias de estas categorías. Para evaluar la capacidad del modelo para diseñar y entregar aplicaciones completas desde el concepto inicial hasta su despliegue funcional, MiniMax introdujo un nuevo marco de evaluación conocido como VIBE, que mide la calidad visual y el comportamiento interactivo en desarrollo web, simulaciones, Android, iOS y backend. A diferencia de los enfoques tradicionales de prueba, VIBE aplica un método automatizado de verificación basado en agentes para examinar tanto la estética de la interfaz como la lógica en tiempo de ejecución.
Según MiniMax, M2.1 logró una puntuación general en VIBE de 88.6, reflejando una fuerte capacidad de desarrollo full-stack, con resultados particularmente altos en desarrollo web con 91.5 y en desarrollo Android con 89.7. La compañía añadió que el modelo también demuestra mejoras continuas en el uso extendido de herramientas y en métricas generales de inteligencia en comparación con la versión anterior M2.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
MiniMax M2.1 ofrece programación avanzada multilingüe para aplicaciones complejas del mundo real
En Resumen
Alibaba respaldó MiniMax lanzó M2.1, un modelo con capacidades potentes en una variedad de lenguajes de programación y para el desarrollo de aplicaciones móviles y web.
El desarrollador chino de IA MiniMax informó del lanzamiento de su modelo M2.1, describiéndolo como una gran actualización diseñada para ofrecer un rendimiento más fuerte en múltiples lenguajes de programación, así como en el desarrollo de aplicaciones móviles y web.
Según la compañía, mientras que la versión anterior M2 se centraba principalmente en reducir costos operativos y mejorar la accesibilidad, la versión M2.1 se enfoca en mejorar la eficacia en tareas complejas del mundo real, con énfasis particular en un soporte más amplio de idiomas y casos prácticos de uso en oficina.
MiniMax afirmó que el modelo ahora ofrece capacidades sustancialmente mejoradas en una amplia gama de lenguajes de programación, incluyendo Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript y JavaScript, permitiendo un desarrollo de extremo a extremo desde la ingeniería de sistemas de bajo nivel hasta la construcción en la capa de aplicación. La compañía también reportó mejoras importantes en el desarrollo web y móvil, fortaleciendo el soporte nativo para Android y iOS, además de ampliar la capacidad del modelo para interpretar requisitos de diseño, generar interfaces visualmente refinadas y construir entornos interactivos avanzados y simulaciones tridimensionales.
La firma además señaló que M2.1 mejora su manejo de conjuntos de instrucciones complejas y la ejecución de tareas integradas, permitiendo un rendimiento más confiable en escenarios de productividad de oficina. En comparación con su predecesor, la nueva versión se describe como capaz de entregar respuestas más cortas y eficientes, tiempos de ejecución más rápidos y menor carga computacional, contribuyendo a flujos de trabajo más suaves para codificación asistida por IA y operaciones basadas en agentes. MiniMax añadió que M2.1 demuestra una fuerte compatibilidad con una variedad de herramientas de desarrollo y marcos de agentes, además de ofrecer una mejor calidad en conversaciones y escritura, produciendo resultados más detallados y mejor estructurados en documentación técnica y contextos de comunicación general.
M2.1 Establece Nuevos Referentes de Rendimiento, Logrando Grandes Mejoras en Evaluaciones Multilingües y Full-Stack
MiniMax informó que su modelo M2.1 muestra ganancias sustanciales en rendimiento en comparación con la versión anterior M2 en los principales benchmarks de ingeniería de software, con resultados particularmente fuertes en tareas de programación multilingüe, donde se le describe como superando a Claude Sonnet 4.5 y acercándose al rendimiento de Claude Opus 4.5. La compañía afirmó que las evaluaciones realizadas en SWE-bench Verified, usando una variedad de marcos de agentes de codificación, indicaron altos niveles de generalización del marco y estabilidad operativa.
Pruebas adicionales de benchmarks que cubren áreas como generación de pruebas, optimización en tiempo de ejecución, revisión de código y cumplimiento de instrucciones, demostraron mejoras amplias respecto a M2, con M2.1 consistentemente igualando o superando a Claude Sonnet 4.5 en varias de estas categorías. Para evaluar la capacidad del modelo para diseñar y entregar aplicaciones completas desde el concepto inicial hasta su despliegue funcional, MiniMax introdujo un nuevo marco de evaluación conocido como VIBE, que mide la calidad visual y el comportamiento interactivo en desarrollo web, simulaciones, Android, iOS y backend. A diferencia de los enfoques tradicionales de prueba, VIBE aplica un método automatizado de verificación basado en agentes para examinar tanto la estética de la interfaz como la lógica en tiempo de ejecución.
Según MiniMax, M2.1 logró una puntuación general en VIBE de 88.6, reflejando una fuerte capacidad de desarrollo full-stack, con resultados particularmente altos en desarrollo web con 91.5 y en desarrollo Android con 89.7. La compañía añadió que el modelo también demuestra mejoras continuas en el uso extendido de herramientas y en métricas generales de inteligencia en comparación con la versión anterior M2.