MiniMax M2.1 забезпечує передове багатомовне програмування для складних реальних застосувань

2025-12-29 13:28:36

Коротко

Alibaba-підтримуваний MiniMax випустив M2.1 — модель із потужними можливостями у різних мовах програмування та для розробки мобільних і веб-додатків.

Китайський розробник штучного інтелекту MiniMax повідомив про випуск своєї моделі M2.1, описуючи її як значне оновлення, спрямоване на забезпечення більшої продуктивності у кількох мовах програмування, а також у розробці мобільних і веб-додатків.

Згідно з компанією, хоча попередня версія M2 переважно зосереджувалася на зниженні операційних витрат і покращенні доступності, реліз M2.1 зосереджений на підвищенні ефективності у складних реальних завданнях, з особливим акцентом на ширше підтримку мов і практичне використання в офісних сценаріях.

MiniMax заявив, що модель тепер пропонує суттєво покращені можливості у широкому спектрі мов програмування, включаючи Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript і JavaScript, що дозволяє розробляти від низькорівневого системного інжинірингу до побудови додатків. Компанія також повідомила про значні покращення у веб- і мобільній розробці, зміцнюючи підтримку нативних Android і iOS, а також розширюючи здатність моделі інтерпретувати дизайн-вимоги, генерувати візуально вдосконалені інтерфейси та створювати передові інтерактивні та тривимірні симуляційні середовища.

Крім того, компанія зазначила, що M2.1 покращує обробку складних наборів інструкцій і інтегроване виконання завдань, що дозволяє більш надійно працювати у сценаріях офісної продуктивності. У порівнянні з попередньою версією, нова модель забезпечує коротші, більш ефективні відповіді, швидший час виконання та зменшене обчислювальне навантаження, що сприяє більш плавним робочим процесам для кодування з підтримкою ШІ та агент-орієнтованих операцій. MiniMax додав, що M2.1 демонструє сильну сумісність із різноманітними інструментами розробки та фреймворками агентів, а також забезпечує покращену якість розмов і написання, створюючи більш детальні та краще структуровані результати у технічній документації та загальній комунікації.

M2.1 встановлює нові стандарти продуктивності, забезпечуючи значні досягнення у багатомовних і повноцінних стекових оцінках

MiniMax повідомив, що його модель M2.1 демонструє суттєве покращення продуктивності у порівнянні з попередньою M2 у основних benchmarks з інженерії програмного забезпечення, з особливо сильними результатами у багатомовних завданнях програмування, де вона перевищує Claude Sonnet 4.5 і наближається до показників Claude Opus 4.5. Компанія заявила, що оцінки, проведені на SWE-bench Verified із використанням різних фреймворків агентів для кодування, показали високий рівень узагальнення фреймворків і стабільності роботи.

Додаткові тестування benchmarks, що охоплюють такі сфери, як генерація тестів, оптимізація часу виконання, огляд коду та відповідність інструкціям, нібито продемонстрували широкі покращення порівняно з M2, при цьому M2.1 послідовно перевищує або відповідає Claude Sonnet 4.5 у кількох категоріях. Щоб оцінити здатність моделі проектувати та доставляти повні додатки від початкової ідеї до функціонального розгортання, MiniMax представив нову систему оцінювання під назвою VIBE, яка вимірює візуальну якість і інтерактивну поведінку у веб-, симуляційних, Android, iOS та бекенд-розробках. На відміну від традиційних підходів тестування, VIBE застосовує автоматизований агент-орієнтований метод перевірки для дослідження як естетики інтерфейсу, так і логіки під час виконання.

Згідно з MiniMax, M2.1 досягла загального балу VIBE 88.6, що відображає сильну здатність до повноцінної стекової розробки, з особливо високими результатами у веб-розробці — 91.5 та Android — 89.7. Компанія додала, що модель також демонструє постійне покращення у розширеному використанні інструментів і загальних показниках інтелекту порівняно з попереднім релізом M2.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.