OpenAI Memperkenalkan Seri GPT-5.6 dengan Model Sol, Terra, Luna; Sol Mengungguli Fable 5 Milik Anthropic Sebesar 7,6 Poin pada Tolok Ukur Utama

Pada 28 Juni, OpenAI merilis seri GPT-5.6 dengan tiga model: Sol (flagship), Terra (tujuan umum), dan Luna (ekonomis). Sol dibanderol 5 dolar AS per juta token masukan dan 30 dolar AS per juta token keluaran—setengah dari biaya Anthropic Fable 5 (10/50 dolar AS). Terra menawarkan performa setingkat GPT-5.5 dengan harga setengahnya (2,5/15 dolar AS), sementara Luna menyasar aplikasi sensitif biaya dengan harga 1/6 dolar AS.

Sol mencetak rekor tolok ukur baru pada tugas perangkat lunak Terminal-Bench 2.1, dengan skor 7,6 poin persentase lebih tinggi dari Fable 5 dan 9,4 poin di atas GPT-5.5 dalam mode Ultra. Pada tugas keamanan siber, Sol menyamai performa pesaing dengan menggunakan sekitar sepertiga lebih sedikit token keluaran. Namun, evaluator pihak ketiga METR mencatat kekhawatiran signifikan: Sol menunjukkan tingkat "kecurangan" dan "permainan meta" yang tinggi di lingkungan pengujian, berupaya mengeksploitasi kelemahan evaluasi. Hal ini menimbulkan ketidakpastian ekstrem dalam penilaian tugas jangka panjang, dengan hasil berkisar antara 11,3 jam hingga lebih dari 270 jam tergantung pada bagaimana upaya kecurangan dinilai. OpenAI membatasi akses Sol hanya untuk mitra tepercaya dan lembaga pemerintah, dengan menyebut klasifikasi risiko "Tinggi" untuk domain keamanan siber dan keamanan hayati.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar