Mini Maxs China kembali menantang perang generatif global dengan model AI 'M2.1'

TechubNews

Perusahaan rintisan kecerdasan buatan MiniMax asal Tiongkok meluncurkan model AI baru M2.1, sekali lagi menantang kompetisi AI generatif di seluruh dunia. Model ini secara signifikan memperkuat diversifikasi bahasa pemrograman dan kemampuan respons terhadap lingkungan kerja nyata, tidak hanya dalam hal bantuan kode, tetapi juga menunjukkan peningkatan kinerja yang komprehensif dalam penulisan dokumen dan respons percakapan.

Peluncuran M2.1 kali ini meningkatkan pemahaman dan akurasi generasi untuk berbagai bahasa pemrograman secara signifikan melalui peningkatan kinerja dibandingkan model pendahulu M2. Bahasa yang didukung kini telah diperluas ke Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript, dan lainnya. Kemampuan desain antarmuka pengguna dan estetika di platform Web, Android, dan iOS juga mendapat pujian yang signifikan.

Yang sangat menonjol adalah, M2.1 tidak hanya memperkuat akurasi eksekusi kode sederhana, tetapi juga kemampuan untuk menafsirkan dan mengikuti instruksi tugas kompleks atau panduan terperinci telah ditingkatkan, sehingga membangun AI yang lebih sesuai dengan lingkungan kerja yang nyata. MiniMax untuk itu meningkatkan kemampuan dialog dan kemampuan penulisan dokumen model, dan menjelaskan bahwa ia menunjukkan kinerja yang luar biasa dalam berbagai rentang dari percakapan sehari-hari hingga penulisan dokumen teknis dan respon terstruktur.

CEO dan salah satu pendiri platform open-source Kilo Code, Scott Breitenother, menyatakan: “Dalam pengujian awal, M2.1 menunjukkan hasil yang sangat baik di seluruh proses pengembangan, termasuk desain arsitektur, pengaturan kode, penilaian, dan penyebaran,” dan menilai bahwa model tersebut memenuhi efisiensi biaya dan kinerja tingkat tinggi.

Model ini juga dievaluasi melalui indikator tolok ukur baru yang disebut VIBE (Vision and Interactive Benchmark for Execution). VIBE dibangun berdasarkan lima bidang inti yaitu Web, simulasi, Android, iOS, dan pengembangan backend, dengan melakukan penilaian komprehensif terhadap logika interaksi dan elemen visual dari hasil yang dihasilkan menggunakan bahasa verifikasi berbasis agen. Menurut MiniMax, M2.1 memperoleh rata-rata 88,6 poin dalam pengujian tolok ukur ini, di mana di bidang Web dan Android masing-masing memperoleh skor yang sangat baik yaitu 91,5 poin dan 89,7 poin.

M2.1 juga telah dibandingkan kinerjanya dengan model AI utama. Dalam hasil evaluasi yang berdampingan dengan model utama dari penyedia besar seperti Anthropic, Google, OpenAI, dan DeepSeek, M2.1 menunjukkan kemampuan pemecahan masalah yang kuat dalam tes benchmark yang sangat sulit seperti “Ujian Terakhir Kemanusiaan” dan “Toolathon”. Terutama dalam proyek HLE w/o Tools, M2.1 mendapatkan 22,0 poin, dan dalam tes gabungan MMLU(Pro) di bidang humaniora, sains, dan teknologi, M2.1 mendapatkan 88 poin, sejajar dengan jajaran model AI teratas.

M2.1 saat ini dapat diunduh melalui API MiniMax atau Hugging Face, dan layanan perwakilan perusahaan untuk MiniMax juga berjalan berdasarkan M2.1. Peluncuran model kali ini menunjukkan dukungan pengkodean multibahasa dan pasar agen AI yang sedang berkembang pesat, serta menandakan bahwa universalitas dan daya saing AI generatif yang berasal dari China terus berkembang.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar