Meituan LongCat เปิดซอร์ส VitaBench 2.0 สำหรับการสร้างโมเดลผู้ใช้ระยะยาว

จากรายงานของ Jin10, Meituan LongCat ได้เปิดเผยซอร์สโค้ด VitaBench 2.0 วันนี้ ซึ่งเป็นเกณฑ์มาตรฐานแรกในการประเมินเอเจนต์โมเดลภาษาขนาดใหญ่ในสถานการณ์การโต้ตอบกับผู้ใช้แบบไดนามิกในโลกจริงระยะยาว เกณฑ์มาตรฐานนี้จะประเมินความสามารถในการปรับเปลี่ยนเฉพาะบุคคลและการดำเนินการเชิงรุกของ LLMs ในการมีส่วนร่วมกับผู้ใช้อย่างต่อเนื่อง
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น