Ini adalah ide liar: bagaimana jika kita mengadakan Arena Kertas di mana berbagai penilai AI bersaing untuk menemukan yang terbaik? Saat ini agak kacau—Anda mengirimkan makalah yang sama dan mendapatkan putusan yang sama sekali berbeda tergantung pada model mana yang mengevaluasinya. Satu AI berkata terima, yang lain berkata tolak. Membuat Anda bertanya-tanya siapa yang sebenarnya tahu apa yang dilakukannya, kan? Akan menarik untuk melihat model-model ini bertarung dan mencari tahu penilai mana yang sebenarnya masuk akal.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Ini adalah ide liar: bagaimana jika kita mengadakan Arena Kertas di mana berbagai penilai AI bersaing untuk menemukan yang terbaik? Saat ini agak kacau—Anda mengirimkan makalah yang sama dan mendapatkan putusan yang sama sekali berbeda tergantung pada model mana yang mengevaluasinya. Satu AI berkata terima, yang lain berkata tolak. Membuat Anda bertanya-tanya siapa yang sebenarnya tahu apa yang dilakukannya, kan? Akan menarik untuk melihat model-model ini bertarung dan mencari tahu penilai mana yang sebenarnya masuk akal.