DeepSeek dan Universitas Peking Merilis Makalah DSpark pada 27 Juni, Pendiri Liang Wenfeng Terdaftar sebagai Penulis

Menurut Guru Club, pada 27 Juni, tim DeepSeek dan Universitas Peking merilis makalah penelitian berjudul "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation." Makalah ini memperkenalkan modul decoding spekulatif untuk mengoptimalkan kinerja inferensi pada model yang sudah ada yaitu DeepSeek-V4-Pro dan DeepSeek-V4-Flash. Secara bersamaan, tim tersebut membuka sumber kode (open-source) DeepSpec, sebuah basis kode penuh untuk melatih dan mengevaluasi model draf decoding spekulatif di bawah lisensi MIT. DeepSpec saat ini mendukung tiga implementasi: DSpark, DFlash, dan Eagle3. Perlu dicatat, pendiri DeepSeek, Liang Wenfeng, tercantum sebagai penulis makalah.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
ManeyToFuturevip
· 1jam yang lalu
Ayo kita gas 🔥
Lihat AsliBalas0