Alibaba-поддерживаемый MiniMax выпустил M2.1 — модель с мощными возможностями в различных языках программирования, а также для разработки мобильных и веб-приложений.
Китайский разработчик ИИ MiniMax сообщил о выпуске своей модели M2.1, описывая её как крупное обновление, предназначенное для повышения производительности в нескольких языках программирования, а также при разработке мобильных и веб-приложений.
По словам компании, в то время как предыдущая версия M2 в основном сосредотачивалась на снижении операционных затрат и улучшении доступности, релиз M2.1 ориентирован на повышение эффективности в сложных реальных задачах, с особым акцентом на расширенную поддержку языков и практические офисные сценарии.
MiniMax заявил, что модель теперь предлагает значительно улучшенные возможности в широком спектре языков программирования, включая Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript и JavaScript, что позволяет осуществлять полный цикл разработки — от низкоуровневой системной инженерии до построения прикладных слоёв. Компания также сообщила о значительных улучшениях в веб- и мобильной разработке, укрепляя поддержку нативных Android и iOS, а также расширяя возможности модели по интерпретации требований дизайна, генерации визуально усовершенствованных интерфейсов и созданию продвинутых интерактивных и трёхмерных симуляционных сред.
Дополнительно, компания отметила, что M2.1 улучшает обработку сложных наборов инструкций и интегрированное выполнение задач, что обеспечивает более надёжную работу в сценариях офисной продуктивности. По сравнению с предшественником, новая версия обеспечивает более короткие и эффективные ответы, более быстрое выполнение и снижение вычислительной нагрузки, что способствует более плавной работе при кодировании с помощью ИИ и операциях на базе агентов. MiniMax добавил, что M2.1 демонстрирует хорошую совместимость с различными инструментами разработки и фреймворками агентов, а также обеспечивает улучшенное качество диалогов и написания, создавая более детализированные и хорошо структурированные результаты в технической документации и в общих коммуникациях.
M2.1 устанавливает новые показатели производительности, достигая значительных успехов в многоязычной и полностековой оценке
MiniMax сообщил, что его модель M2.1 показывает существенный прирост производительности по сравнению с предыдущей M2 во многих ключевых бенчмарках разработки программного обеспечения, особенно в многоязычных задачах программирования, где она превосходит Claude Sonnet 4.5 и приближается к показателям Claude Opus 4.5. Компания заявила, что оценки, проведённые на SWE-bench Verified с использованием различных фреймворков для агентов кодирования, показали высокий уровень обобщения и стабильности работы.
Дополнительные тесты бенчмарков, охватывающие такие области, как генерация тестов, оптимизация времени выполнения, обзор кода и соблюдение инструкций, по сообщениям, продемонстрировали широкие улучшения по сравнению с M2, при этом M2.1 постоянно превосходит или равен Claude Sonnet 4.5 по нескольким категориям. Для оценки способности модели проектировать и реализовывать полноценные приложения от начальной идеи до функционального развертывания MiniMax представил новую систему оценки под названием VIBE, которая измеряет визуальное качество и интерактивное поведение в веб-, симуляционных, Android-, iOS- и бэкенд-разработках. В отличие от традиционных методов тестирования, VIBE использует автоматизированный агентный метод проверки для оценки эстетики интерфейса и логики выполнения.
По словам MiniMax, M2.1 достигла общего балла VIBE 88.6, что отражает сильные возможности полностековой разработки, особенно высокие показатели в веб-разработке — 91.5 и Android — 89.7. Компания добавила, что модель также демонстрирует постоянные улучшения в использовании расширенных инструментов и общих показателях интеллекта по сравнению с предыдущим релизом M2.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
MiniMax M2.1 обеспечивает расширенное многоязыковое программирование для сложных реальных приложений
Кратко
Alibaba-поддерживаемый MiniMax выпустил M2.1 — модель с мощными возможностями в различных языках программирования, а также для разработки мобильных и веб-приложений.
Китайский разработчик ИИ MiniMax сообщил о выпуске своей модели M2.1, описывая её как крупное обновление, предназначенное для повышения производительности в нескольких языках программирования, а также при разработке мобильных и веб-приложений.
По словам компании, в то время как предыдущая версия M2 в основном сосредотачивалась на снижении операционных затрат и улучшении доступности, релиз M2.1 ориентирован на повышение эффективности в сложных реальных задачах, с особым акцентом на расширенную поддержку языков и практические офисные сценарии.
MiniMax заявил, что модель теперь предлагает значительно улучшенные возможности в широком спектре языков программирования, включая Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript и JavaScript, что позволяет осуществлять полный цикл разработки — от низкоуровневой системной инженерии до построения прикладных слоёв. Компания также сообщила о значительных улучшениях в веб- и мобильной разработке, укрепляя поддержку нативных Android и iOS, а также расширяя возможности модели по интерпретации требований дизайна, генерации визуально усовершенствованных интерфейсов и созданию продвинутых интерактивных и трёхмерных симуляционных сред.
Дополнительно, компания отметила, что M2.1 улучшает обработку сложных наборов инструкций и интегрированное выполнение задач, что обеспечивает более надёжную работу в сценариях офисной продуктивности. По сравнению с предшественником, новая версия обеспечивает более короткие и эффективные ответы, более быстрое выполнение и снижение вычислительной нагрузки, что способствует более плавной работе при кодировании с помощью ИИ и операциях на базе агентов. MiniMax добавил, что M2.1 демонстрирует хорошую совместимость с различными инструментами разработки и фреймворками агентов, а также обеспечивает улучшенное качество диалогов и написания, создавая более детализированные и хорошо структурированные результаты в технической документации и в общих коммуникациях.
M2.1 устанавливает новые показатели производительности, достигая значительных успехов в многоязычной и полностековой оценке
MiniMax сообщил, что его модель M2.1 показывает существенный прирост производительности по сравнению с предыдущей M2 во многих ключевых бенчмарках разработки программного обеспечения, особенно в многоязычных задачах программирования, где она превосходит Claude Sonnet 4.5 и приближается к показателям Claude Opus 4.5. Компания заявила, что оценки, проведённые на SWE-bench Verified с использованием различных фреймворков для агентов кодирования, показали высокий уровень обобщения и стабильности работы.
Дополнительные тесты бенчмарков, охватывающие такие области, как генерация тестов, оптимизация времени выполнения, обзор кода и соблюдение инструкций, по сообщениям, продемонстрировали широкие улучшения по сравнению с M2, при этом M2.1 постоянно превосходит или равен Claude Sonnet 4.5 по нескольким категориям. Для оценки способности модели проектировать и реализовывать полноценные приложения от начальной идеи до функционального развертывания MiniMax представил новую систему оценки под названием VIBE, которая измеряет визуальное качество и интерактивное поведение в веб-, симуляционных, Android-, iOS- и бэкенд-разработках. В отличие от традиционных методов тестирования, VIBE использует автоматизированный агентный метод проверки для оценки эстетики интерфейса и логики выполнения.
По словам MiniMax, M2.1 достигла общего балла VIBE 88.6, что отражает сильные возможности полностековой разработки, особенно высокие показатели в веб-разработке — 91.5 и Android — 89.7. Компания добавила, что модель также демонстрирует постоянные улучшения в использовании расширенных инструментов и общих показателях интеллекта по сравнению с предыдущим релизом M2.