概要アリババ支援のMiniMaxは、さまざまなプログラミング言語やモバイル・Webアプリ開発において強力な機能を持つモデルM2.1をリリースしました。中国のAI開発企業MiniMaxは、M2.1モデルのリリースを報告し、これは複数のプログラミング言語やモバイル・Webアプリケーション開発においてより強力なパフォーマンスを提供するために設計された大規模なアップグレードであると説明しています。同社によると、従来のM2バージョンは主に運用コストの削減とアクセシビリティの向上に焦点を当てていましたが、M2.1のリリースは、より広範な言語サポートや実用的なオフィスユースケースに特に重点を置きながら、複雑な実世界のタスクにおける効果性の向上に集中しています。MiniMaxは、モデルがRust、Java、Golang、C++、Kotlin、Objective-C、TypeScript、JavaScriptなど、多くのプログラミング言語で大幅に改善された能力を提供し、低レベルのシステムエンジニアリングからアプリケーション層の構築までエンドツーエンドの開発を可能にしていると述べました。また、Webおよびモバイル開発においても大きな強化が行われ、ネイティブのAndroidとiOSのサポートを強化するとともに、デザイン要件の解釈、視覚的に洗練されたインターフェースの生成、先進的なインタラクティブおよび3Dシミュレーション環境の構築能力を拡大しています。さらに、M2.1は複雑な命令セットや統合されたタスク実行の処理能力を向上させ、オフィスの生産性シナリオにおいてより信頼性の高いパフォーマンスを実現しています。従来のバージョンと比較して、新バージョンはより短く効率的な応答、より高速な実行時間、計算負荷の軽減を実現し、AI支援のコーディングやエージェントベースの運用のワークフローを円滑にしています。MiniMaxは、M2.1がさまざまな開発ツールやエージェントフレームワークと高い互換性を持ち、会話や文章作成の品質も向上しており、技術文書や一般的なコミュニケーションの場面でより詳細で構造化された出力を生成すると付け加えました。## M2.1は新たなパフォーマンス基準を設定し、多言語およびフルスタック評価で大きな成果を達成MiniMaxは、M2.1モデルが従来のM2バージョンと比較して主要なソフトウェアエンジニアリングのベンチマークで大幅な性能向上を示し、多言語プログラミングタスクではClaude Sonnet 4.5を超え、Claude Opus 4.5に近づいていると報告しました。同社は、さまざまなコーディングエージェントフレームワークを用いたSWE-bench Verifiedでの評価により、高いフレームワークの一般化能力と運用の安定性が示されたと述べています。テスト生成、ランタイム最適化、コードレビュー、命令遵守などの分野をカバーする追加のベンチマークテストも、M2に比べて広範な改善を示し、M2.1はこれらのカテゴリーのいくつかでClaude Sonnet 4.5を上回るか同等の性能を維持しています。モデルの初期コンセプトから実用的な展開までの完全なアプリケーション設計と提供能力を評価するために、MiniMaxはVIBEと呼ばれる新しい評価フレームワークを導入しました。これはWeb、シミュレーション、Android、iOS、バックエンド開発における視覚品質とインタラクティブな挙動を測定します。従来のテスト手法とは異なり、VIBEは自動化されたエージェントベースの検証方法を適用し、インターフェースの美観とランタイムロジックの両方を検証します。MiniMaxによると、M2.1は全体のVIBEスコア88.6を獲得し、フルスタック開発能力の高さを示しています。特にWeb開発では91.5、Android開発では89.7と高い結果を出しています。同社はまた、拡張ツールの使用や全体的な知能指標においても、前のM2リリースと比較して継続的な改善を示していると付け加えました。
MiniMax M2.1は、複雑な実世界のアプリケーション向けに高度な多言語プログラミングを提供します
概要
アリババ支援のMiniMaxは、さまざまなプログラミング言語やモバイル・Webアプリ開発において強力な機能を持つモデルM2.1をリリースしました。
中国のAI開発企業MiniMaxは、M2.1モデルのリリースを報告し、これは複数のプログラミング言語やモバイル・Webアプリケーション開発においてより強力なパフォーマンスを提供するために設計された大規模なアップグレードであると説明しています。
同社によると、従来のM2バージョンは主に運用コストの削減とアクセシビリティの向上に焦点を当てていましたが、M2.1のリリースは、より広範な言語サポートや実用的なオフィスユースケースに特に重点を置きながら、複雑な実世界のタスクにおける効果性の向上に集中しています。
MiniMaxは、モデルがRust、Java、Golang、C++、Kotlin、Objective-C、TypeScript、JavaScriptなど、多くのプログラミング言語で大幅に改善された能力を提供し、低レベルのシステムエンジニアリングからアプリケーション層の構築までエンドツーエンドの開発を可能にしていると述べました。また、Webおよびモバイル開発においても大きな強化が行われ、ネイティブのAndroidとiOSのサポートを強化するとともに、デザイン要件の解釈、視覚的に洗練されたインターフェースの生成、先進的なインタラクティブおよび3Dシミュレーション環境の構築能力を拡大しています。
さらに、M2.1は複雑な命令セットや統合されたタスク実行の処理能力を向上させ、オフィスの生産性シナリオにおいてより信頼性の高いパフォーマンスを実現しています。従来のバージョンと比較して、新バージョンはより短く効率的な応答、より高速な実行時間、計算負荷の軽減を実現し、AI支援のコーディングやエージェントベースの運用のワークフローを円滑にしています。MiniMaxは、M2.1がさまざまな開発ツールやエージェントフレームワークと高い互換性を持ち、会話や文章作成の品質も向上しており、技術文書や一般的なコミュニケーションの場面でより詳細で構造化された出力を生成すると付け加えました。
M2.1は新たなパフォーマンス基準を設定し、多言語およびフルスタック評価で大きな成果を達成
MiniMaxは、M2.1モデルが従来のM2バージョンと比較して主要なソフトウェアエンジニアリングのベンチマークで大幅な性能向上を示し、多言語プログラミングタスクではClaude Sonnet 4.5を超え、Claude Opus 4.5に近づいていると報告しました。同社は、さまざまなコーディングエージェントフレームワークを用いたSWE-bench Verifiedでの評価により、高いフレームワークの一般化能力と運用の安定性が示されたと述べています。
テスト生成、ランタイム最適化、コードレビュー、命令遵守などの分野をカバーする追加のベンチマークテストも、M2に比べて広範な改善を示し、M2.1はこれらのカテゴリーのいくつかでClaude Sonnet 4.5を上回るか同等の性能を維持しています。モデルの初期コンセプトから実用的な展開までの完全なアプリケーション設計と提供能力を評価するために、MiniMaxはVIBEと呼ばれる新しい評価フレームワークを導入しました。これはWeb、シミュレーション、Android、iOS、バックエンド開発における視覚品質とインタラクティブな挙動を測定します。従来のテスト手法とは異なり、VIBEは自動化されたエージェントベースの検証方法を適用し、インターフェースの美観とランタイムロジックの両方を検証します。
MiniMaxによると、M2.1は全体のVIBEスコア88.6を獲得し、フルスタック開発能力の高さを示しています。特にWeb開発では91.5、Android開発では89.7と高い結果を出しています。同社はまた、拡張ツールの使用や全体的な知能指標においても、前のM2リリースと比較して継続的な改善を示していると付け加えました。