Mercury 2 ของ Inception Labs ทำคะแนนได้ 90% ใน AIME 2026 และทำได้ดีกว่า DiffusionGemma ของ Google

เมื่อวันพฤหัสบดี (18 มิถุนายน) Inception Labs เปิดตัว Mercury 2 โดยอ้างว่าเป็นโมเดลภาษาสำหรับการให้เหตุผลที่เร็วที่สุดในโลก สร้างได้ประมาณ 1,000 โทเคนต่อวินาที ตามประกาศของบริษัท Mercury 2 ทำคะแนนได้ 90% ใน AIME 2026 (American Invitational Mathematics Examination) เทียบกับ DiffusionGemma ของ Google ที่ 69.1% ในเกณฑ์เดียวกัน โมเดลยังทำได้ 77% ใน GPQA ซึ่งเป็นแบบทดสอบระดับวิทยาศาสตร์ระดับปริญญาเอก Augment Code บริษัทด้านเอเจนต์การเขียนโค้ดด้วย AI รายงานว่าใช้เวลาแฝง (latency) ลดลง 82% และต้นทุนลดลง 90% หลังจากสลับ Mercury 2 เป็น Claude Opus 4.7 ของ Anthropic โดยยังคงคุณภาพผลลัพธ์ไว้ได้
news.article.disclaimer

news.related.news

แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น