مؤسس OpenClaw يشارك تصنيف معدل توافق نماذج الذكاء الاصطناعي، حيث تأتي minimax-m2.1 و kimi-k2.5 الصنع المحلي في المركزين 2 و 3 على التوالي

أخبار Gate، في 8 مارس، أعاد مؤسس OpenClaw (إطار تطوير الوكيل الذكي) بيتر ستاينبرغر مشاركة نتائج اختبار معيارية من طرف ثالث من قبل PinchBench، والتي تقيم أداء نماذج اللغة الكبيرة في مهام وكيل OpenClaw. أظهرت النتائج أن Gemini 3 Flash حققت معدل نجاح 95.1% في مهمة OpenClaw، مما جعله في المركز الأول، تلاه النماذج المحلية minimax-m2.1 و kimi-k2.5 بنسبة 93.6% و 93.4% على التوالي، في المركزين الثاني والثالث. كانت نسبة نجاح Claude Sonnet 4.5 هي 92.7%، و GPT-4o بنسبة 85.2%.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات