MiniMax M2.1 يوفر برمجة متعددة اللغات متقدمة للتطبيقات المعقدة في العالم الحقيقي

2025-12-29 13:28:36

ملخص سريع

أطلقت شركة MiniMax المدعومة من علي بابا نموذج M2.1، وهو نموذج يمتلك قدرات قوية عبر مجموعة متنوعة من لغات البرمجة ولتطوير تطبيقات الهاتف المحمول والويب.

أفاد مطور الذكاء الاصطناعي الصيني MiniMax عن إصدار نموذج M2.1، ووصفه بأنه ترقية كبيرة مصممة لتقديم أداء أقوى عبر عدة لغات برمجة بالإضافة إلى تطوير تطبيقات الهاتف المحمول والويب.

ووفقًا للشركة، بينما ركز الإصدار السابق M2 بشكل رئيسي على تقليل تكاليف التشغيل وتحسين الوصول، يركز إصدار M2.1 الآن على تحسين الفعالية في المهام المعقدة في العالم الحقيقي، مع التركيز بشكل خاص على دعم لغات أوسع وحالات الاستخدام العملية في المكاتب.

ذكرت MiniMax أن النموذج الآن يوفر قدرات محسنة بشكل كبير عبر مجموعة واسعة من لغات البرمجة، بما في ذلك Rust و Java و Golang و C++ و Kotlin و Objective-C و TypeScript و JavaScript، مما يمكّن من التطوير من طرف إلى طرف من هندسة الأنظمة منخفضة المستوى إلى بناء طبقة التطبيقات. كما أبلغت الشركة عن تحسينات كبيرة في تطوير الويب والهاتف المحمول، مع تعزيز دعم Android و iOS الأصليين مع توسيع قدرة النموذج على تفسير متطلبات التصميم، وتوليد واجهات مرئية محسنة، وبناء بيئات تفاعلية ومحاكاة ثلاثية الأبعاد متقدمة.

وأشارت الشركة أيضًا إلى أن M2.1 يحسن من تعامله مع مجموعات التعليمات المعقدة وتنفيذ المهام المدمجة، مما يسمح بأداء أكثر موثوقية في سيناريوهات إنتاجية المكتب. مقارنة بسابقه، يوصف الإصدار الجديد بأنه يقدم استجابات أقصر وأكثر كفاءة، وأوقات تنفيذ أسرع، وتقليل الحمل الحسابي، مما يساهم في تدفقات عمل أكثر سلاسة للترميز المدعوم بالذكاء الاصطناعي والعمليات المعتمدة على الوكلاء. وأضافت MiniMax أن M2.1 يظهر توافقًا قويًا مع مجموعة متنوعة من أدوات التطوير وأطر الوكلاء، ويوفر جودة محادثة وكتابة محسنة، مع إنتاج مخرجات أكثر تفصيلًا وتنظيمًا بشكل أفضل عبر الوثائق التقنية وسياقات التواصل العامة.

M2.1 يضع معايير أداء جديدة، ويحقق مكاسب كبيرة عبر التقييمات متعددة اللغات والتقييمات الكاملة للطبقات

أبلغت MiniMax أن نموذج M2.1 يظهر مكاسب أداء كبيرة مقارنة بالإصدار السابق M2 عبر معايير هندسة البرمجيات الرئيسية، مع نتائج قوية بشكل خاص في مهام البرمجة متعددة اللغات، حيث يُوصف بأنه يتفوق على Claude Sonnet 4.5 ويقترب من أداء Claude Opus 4.5. وذكرت الشركة أن التقييمات التي أُجريت على SWE-bench Verified، باستخدام مجموعة من أطر وكلاء الترميز، أظهرت مستويات عالية من التعميم التشغيلي واستقرار العمليات.

وأظهرت اختبارات معيارية إضافية تغطي مجالات مثل توليد الاختبارات، وتحسين وقت التشغيل، ومراجعة الشفرة، والامتثال للتعليمات، تحسينات واسعة على M2، مع تطابق أو تفوق M2.1 بشكل مستمر على Claude Sonnet 4.5 في العديد من هذه الفئات. ولتقييم قدرة النموذج على تصميم وتقديم تطبيقات كاملة من المفهوم الأولي إلى النشر الوظيفي، قدمت MiniMax إطار تقييم جديد يُعرف باسم VIBE، يقيس الجودة البصرية والسلوك التفاعلي عبر الويب، والمحاكاة، وAndroid، وiOS، وتطوير الخلفية. وعلى عكس الأساليب التقليدية للاختبار، يطبق VIBE طريقة تحقق آلية تعتمد على الوكيل لفحص كل من جمالية الواجهة والمنطق أثناء التشغيل.

ووفقًا لـ MiniMax، حقق M2.1 درجة VIBE إجمالية قدرها 88.6، مما يعكس قدرة قوية على التطوير الكامل للطبقات، مع نتائج عالية بشكل خاص في تطوير الويب عند 91.5 وفي تطوير Android عند 89.7. وأضافت الشركة أن النموذج يُظهر أيضًا تحسينات مستمرة في استخدام الأدوات الموسعة ومقاييس الذكاء العام مقارنة بالإصدار السابق M2.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.