Wow, @arena dibuat oleh orang Taiwan?


Belakangan ini daftar peringkat AI coding sangat layak dilihat 👀
Tapi saya rasa fokusnya sudah bukan lagi “siapa yang nomor satu”.
Yang benar-benar penting adalah: peringkat model AI, semakin tidak begitu langka. 🧠⚡️
Dulu orang mengira AI akan menjadi pemenang yang mendominasi:
GPT-4 jauh di depan,
model lain hanya bisa mengejar.
Tapi sekarang kamu lihat daftar seperti Arena, model di barisan depan semakin padat. Claude, OpenAI, Google, GLM, Qwen, Kimi, berbagai model open source dan tertutup semuanya berkumpul dalam rentang kemampuan yang sama. Skor Elo semakin menyempit, menandakan kemampuan model sedang cepat distandarisasi.
Ini sangat mirip dengan listrik dan air 🚰
Kamu membuka keran air, tidak terlalu peduli dari perusahaan mana air itu berasal.
Yang kamu pedulikan adalah:
- Apakah harganya murah?
- Apakah stabil?
- Apakah akan mati mendadak?
- Apakah bisa terintegrasi ke alur kerja kamu?
Model AI juga sedang menuju ke arah ini.
Ketika perbedaan kemampuan model menyempit, pasar harus menetapkan harga ulang bukan lagi berdasarkan “siapa yang paling pintar”, tetapi:
🧩 Siapa yang bisa mengintegrasikan ke dalam alur kerja
💰 Siapa yang biaya inferensinya paling rendah
🔒 Siapa yang mampu memenuhi standar perusahaan dan keamanan data
📊 Siapa yang memiliki feedback data dan retensi pengguna
🛠 Siapa yang bisa mengubah model menjadi produk, bukan sekadar demo
Terutama model coding yang lebih jelas.
Engineer akhirnya tidak selalu memilih “peringkat pertama”.
Mereka akan memilih yang paling stabil, paling murah, paling paham kode mereka, paling tidak akan tiba-tiba rusak.
Itulah mengapa saat saya melihat daftar Arena, yang pertama saya perhatikan bukan peringkatnya, tetapi struktur perubahannya.
Semakin padat posisi dua puluh besar, semakin tipis benteng perlindungan model itu sendiri.
Nilai akan bergeser ke produk, data, distribusi, biaya komputasi, kemampuan deployment perusahaan. 🏗️
Ada satu hal yang sangat menarik:
Arena, infrastruktur pengujian AI global ini, salah satu pendiri utamanya Wei-Lin Chiang adalah lulusan dari Fakultas Ilmu Komputer Universitas Taiwan, kemudian melakukan riset di UC Berkeley, dan membangun sistem penilaian blind test Chatbot Arena.
Dulu, narasi terkuat di AI biasanya tentang chip, server, rantai pasokan.
Tapi Arena mengingatkan kita:
Tidak hanya bisa membangun infrastruktur hardware AI.
Kita juga bisa berpartisipasi dalam infrastruktur kepercayaan AI. 🌏
Masa depan, masalah terpenting dalam industri AI mungkin bukan:
“Siapa model terkuat?”
Tapi:
“Siapa yang berhak mendefinisikan apa yang disebut kuat?”
“Siapa yang bisa menjadi lembaga penilaian kredit dunia model?”
“Siapa yang bisa membuat pasar percaya bahwa peringkat AI ini nyata?”
Dua tahun lalu, model terkuat sendiri adalah benteng perlindungan.
Tapi di tahap berikutnya, yang benar-benar bernilai adalah:
- Bagaimana model dievaluasi,
- Bagaimana model di-deploy,
- Bagaimana model dipercaya,
- Bagaimana model digunakan secara jangka panjang oleh perusahaan.
Perang AI sedang beralih dari “kemampuan model” ke “infrastruktur”. 🚀
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan