Meituan LongCat เปิดซอร์ส VitaBench 2.0 สำหรับการสร้างโมเดลผู้ใช้ระยะยาว

2026-06-25 12:07:04

จากรายงานของ Jin10, Meituan LongCat ได้เปิดเผยซอร์สโค้ด VitaBench 2.0 วันนี้ ซึ่งเป็นเกณฑ์มาตรฐานแรกในการประเมินเอเจนต์โมเดลภาษาขนาดใหญ่ในสถานการณ์การโต้ตอบกับผู้ใช้แบบไดนามิกในโลกจริงระยะยาว เกณฑ์มาตรฐานนี้จะประเมินความสามารถในการปรับเปลี่ยนเฉพาะบุคคลและการดำเนินการเชิงรุกของ LLMs ในการมีส่วนร่วมกับผู้ใช้อย่างต่อเนื่อง

news.view.source

news.article.disclaimer

news.related.news

2 ชั่วโมง ที่แล้ว

OpenAI และ Broadcom เปิดตัวชิป Jalapeno AI สำหรับการอนุมาน LLM ในวันที่ 25 มิถุนายน

3 ชั่วโมง ที่แล้ว

XHunt เปิดตัว v0.3.4 เปิดตัวอันดับ Top 50,000 AI KOL วันนี้

3 ชั่วโมง ที่แล้ว

World ขยายการเข้าถึง Agentkit ในวันที่ 24 มิถุนายน AI Agents จัดการการซื้อใน 4 ประเทศด้วยการทดลอง 500-Hat

10 ชั่วโมง ที่แล้ว

OpenAI อัปเดต GPT-5.5 Instant ด้วยความสามารถในการปรับโทนเสียงอัตโนมัติ เปิดให้ผู้ใช้ที่ชำระเงินก่อน

06-24 03:40