Meituan LongCat-2.0 sumber terbuka: 1,6 triliun parameter tanpa GPU NVIDIA

Dilaporkan oleh Reuters pada 30 Juni, Meituan merilis model AI open-source LongCat-2.0 dengan skala parameter 1,6 triliun, menggunakan arsitektur Sparse Mixture of Experts (MoE), sepenuhnya dilatih menggunakan chip klaster super ASIC buatan dalam negeri, tanpa menggunakan GPU NVIDIA atau tumpukan perangkat lunak CUDA, dan jendela konteks model mencapai 1 juta token.

Spesifikasi Teknis dan Skenario Aplikasi Target LongCat-2.0

LongCat-2.0 menggunakan arsitektur Sparse Mixture of Experts (MoE), mirip dengan pendekatan DeepSeek dan Mixtral milik Mistral: model tidak mengaktifkan semua 1,6 triliun parameter secara bersamaan, melainkan router internal memilih sekelompok sub-model khusus untuk setiap token, sehingga dapat mengurangi biaya inferensi dibandingkan dengan model padat dengan ukuran yang sama. Spesifikasi teknis utama dan batasan penerapan adalah sebagai berikut:

Skala parameter: 1,6 triliun (arsitektur MoE jarang, tidak mengaktifkan semua parameter secara bersamaan) Jendela konteks: 1 juta token (DeepSeek-R1-0528 dan GPT-OSS masing-masing 128 ribu token) Perangkat keras pelatihan: Klaster super ASIC buatan dalam negeri (tanpa GPU NVIDIA, tanpa tumpukan perangkat lunak CUDA) Aplikasi target: Agen AI, alat pengkodean (pemahaman kode, pengeditan seluruh perpustakaan, tugas otomatis) Bentuk penerapan: Klaster inferensi tingkat pusat data, tidak mendukung perangkat konsumen atau sebagian besar penerapan lokal

Latar Belakang Pasar Pelatihan Chip Dalam Negeri dan Data Bernstein

Meituan mengklaim bahwa arsitektur inferensi inti LongCat-2.0 bersifat portabel dan dapat berjalan pada perangkat keras yang ada di Tiongkok. Peluncuran ini terjadi ketika kontrol ekspor AS terus membatasi ekspor chip AI canggih ke perusahaan Tiongkok.

Perusahaan riset saham Bernstein memperkirakan bahwa NVIDIA saat ini menguasai sekitar 40% pangsa pasar chip AI di Tiongkok, dengan pangsa Huawei yang serupa; Bernstein juga memprediksi bahwa Huawei akan membuat kemajuan tahun ini, sehingga pangsa pasar NVIDIA di Tiongkok turun sekitar 8 poin persentase.

Status Klaim Kinerja Saat Ini: Belum Ada Verifikasi Pihak Ketiga

Dalam tolok ukur yang dirilis, Meituan membandingkan LongCat-2.0 dengan beberapa model sumber tertutup, namun laporan terkait menunjukkan bahwa klaim kinerja ini belum memperoleh verifikasi evaluasi pihak ketiga yang independen dan tidak memihak.

Laporan juga menunjukkan bahwa optimalisasi untuk chip dalam negeri dapat membatasi kinerja LongCat-2.0 pada perangkat keras NVIDIA, sementara perangkat keras NVIDIA masih mendominasi pusat data global. Meituan menyatakan bahwa arsitektur inferensi intinya masih portabel, dan pengujian independen akan menentukan kemauan adopsi pengembang di luar Tiongkok.

Pertanyaan Umum

Apa saja skenario aplikasi yang relevan dengan jendela konteks 1 juta token LongCat-2.0?

Pada saat pelaporan, batas jendela konteks DeepSeek-R1-0528 dan OpenAI GPT-OSS masing-masing adalah 128 ribu token; LongCat-2.0 mengklaim mencapai 1 juta token, yang memiliki potensi signifikansi bagi aplikasi agen AI yang perlu menangani basis kode yang sangat panjang dan rantai tugas yang kompleks. Namun, klaim spesifikasi di atas masih menunggu verifikasi independen.

Apa latar belakang penelitian AI Meituan?

Bisnis inti Meituan adalah pengiriman makanan dan layanan kehidupan lokal. Pada tahun 2023, mereka memasuki bidang AI setelah mengakuisisi perusahaan rintisan AI Light Year Beyond seharga 281 juta dolar AS. Baru pada tahun 2025 mereka secara terbuka mengumumkan rencana model internal. LongCat-2.0 diposisikan sebagai mesin inferensi untuk agen AI dan alat pengkodean perusahaan.

Apa kelebihan dan kekurangan arsitektur MoE jarang LongCat-2.0 dibandingkan dengan model padat 1,6 triliun?

Keunggulan inti MoE jarang adalah tidak mengaktifkan semua parameter, melainkan merutekan ke sub-model tertentu, yang dapat mengurangi biaya komputasi inferensi dibandingkan dengan model padat dengan ukuran yang sama. Namun, arsitektur yang dioptimalkan untuk perangkat keras tertentu (seperti ASIC dalam negeri) mungkin memiliki keterbatasan kinerja pada perangkat keras lain (seperti GPU NVIDIA). Hasil pengujian independen belum diumumkan.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar