DeepSeek และ Peking University เผยแพร่เอกสาร DSpark ในวันที่ 27 มิถุนายน โดยมีผู้ก่อตั้ง Liang Wenfeng อยู่ในรายชื่อผู้เขียน

ตามที่ Guru Club รายงาน เมื่อวันที่ 27 มิถุนายน ทีม DeepSeek และมหาวิทยาลัยปักกิ่งได้เผยแพร่เอกสารวิจัยชื่อ "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation" เอกสารดังกล่าวแนะนำโมดูล speculative decoding เพื่อเพิ่มประสิทธิภาพการอนุมานบนโมเดลที่มีอยู่ DeepSeek-V4-Pro และ DeepSeek-V4-Flash ในเวลาเดียวกัน ทีมงานได้เปิดเผยซอร์สโค้ด DeepSpec ซึ่งเป็นชุดโค้ดแบบ full-stack สำหรับฝึกและประเมินโมเดลร่าง speculative decoding ภายใต้ใบอนุญาต MIT ปัจจุบัน DeepSpec รองรับการใช้งานสามแบบ: DSpark, DFlash และ Eagle3 ที่น่าสังเกตคือ หลี่ เหวินเฟิง (Liang Wenfeng) ผู้ก่อตั้ง DeepSeek ถูกระบุเป็นผู้เขียนเอกสาร
news.article.disclaimer
แสดงความคิดเห็น
0/400
ManeyToFuturevip
· 1 ชั่วโมง ที่แล้ว
LFG 🔥
ตอบกลับ0