DeepSeek Memperkenalkan Metode Visual Primitives untuk Meningkatkan Penalaran Multimodal pada 30 April

Dalam laporan teknis DeepSeek, pada 30 April, perusahaan memperkenalkan Visual Primitives, sebuah metode yang menyematkan unit visual dasar seperti titik dan kotak pembatas ke dalam rangkaian penalaran untuk mengatasi masalah Reference Gap pada tugas multimodal. Metode ini mengurangi konsumsi token gambar melalui kompresi KV cache.

Pada tolok ukur penalaran penghitung dan spasial, pendekatan tersebut menyamai kinerja GPT-5.4, Claude-Sonnet-4.6, dan Gemini-3-Flash di beberapa dimensi terpilih. DeepSeek menyatakan akan membuka sumber sebagian tolok ukur dan kumpulan data, dengan bobot model yang akan dirilis setelah integrasi.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar