AI membuat para ahli semakin bodoh? Penelitian terbaru Nature: tingkat deteksi kesalahan dokter turun 6%, dan skor ujian insinyur berkurang 17 poin

Penelitian kolonoskopi di Poland menunjukkan bahwa setelah dokter memperkenalkan AI sebagai bantuan, tingkat deteksi adenoma pada sesi di mana AI dimatikan turun dari 28,4% menjadi 22,4%; uji acak kontrol oleh Anthropic terhadap 52 insinyur tingkat dasar menunjukkan bahwa, setelah tes, kelompok AI mendapatkan rata-rata 50 poin, sedangkan kelompok manual 67 poin, selisihnya setara dengan dua tingkat huruf.
(Latar belakang: Penelitian Anthropic: Keahlian domain lebih menentukan hasil generasi Claude Code daripada kemampuan menulis kode)
(Tambahan latar: Claude memiliki 80% kode yang ditulis sendiri, Anthropic menyerukan "mekanisme rem global untuk desain" apakah serius?)

Daftar isi artikel

Toggle

  • Setelah dokter mematikan AI, tingkat deteksi turun 6 poin persentase
  • Percobaan yang dilakukan Anthropic sendiri, hasilnya juga tidak bagus
  • Penurunan kemampuan bukanlah peringatan fiksi ilmiah, melainkan proses saat ini

Setelah dokter menggunakan AI, mereka melewatkan lebih banyak tumor saat tidak didukung AI. Setelah insinyur menggunakan AI, nilai ujian mereka berkurang 17 poin. Kedua angka ini berasal dari dua studi peer-review yang dipublikasikan pada tahun 2026, yang dirangkum oleh Nature pada 21 Juni.

Kesimpulannya, alat AI sambil meningkatkan efisiensi jangka pendek, secara sistematis mengikis kemampuan inti pelaku manusia. Yuichi Mori, peneliti dari Universitas Oslo, secara langsung mengatakan: "Saat ini tidak ada solusi yang terbukti untuk melawan penurunan kemampuan ini, ini harus menjadi topik penelitian terpanas dalam sepuluh tahun ke depan."

Setelah dokter mematikan AI, tingkat deteksi turun 6 poin persentase

Percobaan ACCEPT di Polandia memilih objek penelitian yang cukup ketat: semua dokter peserta telah menyelesaikan minimal 2.000 kolonoskopi, merupakan dokter spesialis dengan pengalaman klinis lengkap, bukan intern. Desain studi memungkinkan dokter menggunakan alat bantu AI pada hari tertentu, sistem menganalisis gambar usus secara real-time dan secara otomatis menandai kecurigaan adenoma, sementara hari lain mereka tidak boleh menggunakannya sama sekali. Hasilnya dipublikasikan di "Gastroenterologi dan Hepatologi".

Sebelum pengenalan AI, tingkat deteksi adenoma dari dokter ini adalah 28,4%. Setelah pengenalan AI, mereka dalam sesi tanpa AI tingkat deteksinya turun menjadi 22,4%, kurang 6 poin persentase.

Penelitian menunjukkan bahwa penggunaan berkelanjutan alat AI dapat membuat dokter klinis "menjadi kurang proaktif, kurang fokus, dan kurang bertanggung jawab terhadap hasil saat mereka harus membuat keputusan kognitif tanpa bantuan AI". Komentar dari Robert Wachter, dokter dari University of California, San Francisco, lebih langsung: bahkan profesional dengan keahlian tinggi pun bisa mengalami kemunduran dalam bidang mereka karena ketergantungan pada alat AI.

Mekanisme ini tidak sulit dipahami. Ketika AI secara jangka panjang menangani tugas "mencari abnormalitas", pola perhatian dokter akan dilatih ulang; begitu kerangka kerja dihapus, otak yang terbiasa "menunggu AI memberi tahu" akan sulit secara otomatis beralih ke keadaan waspada tinggi.

Anthropic sendiri melakukan percobaan, hasilnya juga tidak bagus

Judy Hanwen Shen dan Alex Tamkin dari Anthropic merilis uji acak kontrol pada 29 Januari 2026. Subjek penelitian adalah 52 insinyur perangkat lunak tingkat dasar, semuanya diminta mempelajari satu paket Python baru yang sama, Trio. Semua dapat mencari dan membaca dokumentasi resmi secara daring; setengah dari mereka dilengkapi dengan asisten AI tambahan.

Kelompok AI mendapatkan rata-rata skor 50%, sedangkan kelompok kode manual 67%, selisih 17 poin persentase, kira-kira setara dengan dua tingkat huruf dalam penilaian akademik. Efisiensi waktu? Kelompok AI menyelesaikan tugas rata-rata hanya 2 menit lebih cepat, tidak signifikan secara statistik. Artinya, insinyur mendapatkan: mengorbankan kedalaman pemahaman sebesar 17 poin, demi kecepatan permukaan 2 menit.

Yang paling parah mengalami penurunan adalah kemampuan debugging. Shen dan Tamkin menyoroti bahaya utama dari hal ini, karena mendeteksi kesalahan yang dihasilkan AI tetap menjadi salah satu fungsi pengawasan manusia yang paling penting. Jika kemampuan debugging insinyur menyusut karena lama-lama mengandalkan AI, maka kesalahan AI akan lebih sulit dideteksi, membentuk lingkaran setan yang memburuk.

Percobaan ini juga mengungkapkan satu detail: insinyur yang menggunakan AI untuk "eksplorasi konsep" mendapatkan skor di atas 65%; sedangkan insinyur yang sepenuhnya menyerahkan "pembuatan kode" kepada AI mendapatkan skor di bawah 40%. Apakah AI alat eksplorasi atau pengganti produksi, hasilnya berbeda 25 poin persentase.

Penurunan kemampuan bukanlah peringatan fiksi ilmiah, melainkan proses saat ini

Dua studi ini tidak menanyakan "apakah AI berguna", melainkan "seberapa banyak kemampuan yang tersisa bagi orang yang menggunakan AI dalam jangka panjang saat mereka tidak lagi didukung AI". Jawaban dari pertanyaan ini mulai muncul dalam data yang dapat diukur.

Saat ini, komunitas akademik hampir tidak memiliki konsensus tentang "frekuensi optimal penggunaan AI sebagai bantuan", dan juga belum ada intervensi yang terbukti efektif untuk "mempertahankan kemampuan inti dalam lingkungan AI". Mori mengatakan ini akan menjadi topik penelitian terpanas dalam sepuluh tahun ke depan, dan saat ini tidak berlebihan, karena kecepatan penurunan kemampuan kemungkinan jauh lebih cepat daripada kecepatan penelitian yang mengikuti.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan