Ribuan orang di seluruh dunia menjual suara, wajah, dan rekaman panggilan untuk memberi makan AI demi mendapatkan penghasilan, namun mereka menghadapi risiko pemalsuan mendalam dan pemberian izin yang tidak dapat dibatalkan.
Panduan Dalam: Sebuah laporan investigasi dari The Guardian di Inggris mengungkapkan industri abu-abu yang sedang tumbuh dengan cepat: ribuan orang di seluruh dunia menghasilkan uang dengan menjual suara, wajah, rekaman panggilan, dan video sehari-hari mereka untuk biaya pelatihan AI. Ini bukan sekadar diskusi umum tentang privasi, tetapi sebuah investigasi dengan tokoh nyata, jumlah nyata, dan konsekuensi nyata—seorang aktor yang menjual wajahnya, kemudian melihat “dirinya” mempromosikan produk medis yang tidak dikenal di Instagram, dengan orang-orang di kolom komentar menilai “penampilannya”. Ketika ketidakpuasan data perusahaan AI berpadu dengan kesenjangan ekonomi global, transaksi yang tidak setara sedang terjadi.
Berikut adalah isi lengkapnya:
Suatu pagi tahun lalu, Jacobus Louw yang tinggal di Cape Town, Afrika Selatan, keluar untuk berjalan-jalan seperti biasa, memberi makan burung camar di sepanjang jalan. Namun kali ini, ia merekam beberapa video—menangkap langkah kakinya dan pemandangan saat berjalan di trotoar. Video tersebut membawanya mendapatkan 14 dolar, sekitar 10 kali lipat dari upah minimum di negara itu, dan setara dengan pengeluaran makanan selama setengah minggu bagi pemuda berusia 27 tahun ini.
Ini adalah tugas “navigasi kota” yang diselesaikan Louw di Kled AI. Kled AI adalah aplikasi yang membayar pengguna untuk mengunggah foto, video, dan data lain yang digunakan untuk melatih model AI. Dalam waktu singkat, Louw menghasilkan 50 dolar dengan mengunggah foto dan video dari kehidupan sehari-harinya.
Ribuan mil jauhnya, di Ranchi, India, mahasiswa berusia 22 tahun, Sahil Tigga, secara rutin menghasilkan uang dengan Silencio—aplikasi yang melakukan crowdsourcing data audio untuk pelatihan AI, yang mengakses mikrofon ponselnya untuk menangkap kebisingan lingkungan di dalam restoran atau di persimpangan yang sibuk. Ia juga mengunggah rekaman suaranya. Sahil pergi ke lokasi unik, seperti lobi hotel yang belum terdaftar di peta Silencio. Ia mengandalkan ini untuk menghasilkan lebih dari 100 dolar sebulan, cukup untuk menutupi seluruh pengeluaran makannya.
Di Chicago, Ramelio Hill, seorang siswa magang pengelasan berusia 18 tahun, menjual rekaman percakapan pribadi di ponselnya dengan teman dan keluarganya kepada Neon Mobile—sebuah platform pelatihan AI percakapan yang membayar 0,50 dolar per menit—dan menghasilkan beberapa ratus dolar. Bagi Hill, perhitungan ini sederhana: ia percaya bahwa perusahaan teknologi sudah memiliki banyak data pribadi miliknya, jadi lebih baik ia juga mendapatkan bagiannya.
“Kerja sampingan untuk pelatihan AI”—mengunggah pemandangan di sekitar, foto diri, video, dan audio—berdiri di garis depan dari gelombang baru penambangan data global. Dengan Silicon Valley yang menginginkan data manusia berkualitas tinggi melebihi apa yang bisa diambil dari internet terbuka, sebuah industri pasar data yang berkembang pesat muncul untuk mengisi kekosongan ini. Dari Cape Town hingga Chicago, ribuan orang sedang memberikan identitas biometrik dan data pribadi mereka untuk melatih generasi AI berikutnya.
Namun ekonomi kerja baru ini datang dengan biaya. Di balik beberapa dolar yang diperoleh, para pelatih ini sedang menyediakan bahan bakar untuk industri yang mungkin akhirnya membuat keterampilan mereka menjadi usang, sekaligus mengekspos diri mereka pada risiko pemalsuan mendalam, pencurian identitas, dan eksploitasi digital di masa depan—yang baru saja mulai mereka sadari.
Model bahasa AI seperti ChatGPT dan Gemini memerlukan bahan pembelajaran yang sangat besar agar dapat terus berkembang, tetapi mereka menghadapi kekurangan data. Sumber data pelatihan yang paling umum—C4, RefinedWeb, dan Dolma—menguasai seperempat dari kumpulan data berkualitas tinggi di internet, dan kini membatasi penggunaan data mereka untuk melatih model AI generatif. Para peneliti memperkirakan bahwa perusahaan AI paling cepat akan kehabisan teks berkualitas tinggi yang tersedia pada tahun 2026. Meskipun beberapa laboratorium telah mulai menggunakan data sintetis yang dihasilkan oleh AI itu sendiri untuk umpan pelatihan, proses rekursif ini akan menghasilkan model yang dipenuhi dengan “sampah” yang salah, yang dapat menyebabkan keruntuhan.
Sumber gambar: The Guardian
Aplikasi seperti Kled AI dan Silencio muncul di sini. Di pasar data ini, jutaan orang memberi makan dan melatih AI dengan menjual data identitas mereka. Selain Kled AI, Silencio, dan Neon Mobile, pelatih AI juga memiliki banyak pilihan: Luel AI yang didukung oleh inkubator terkemuka Y-Combinator, yang mendapatkan bahan percakapan multibahasa dengan harga sekitar 0,15 dolar per menit; ElevenLabs yang memungkinkan Anda untuk melakukan kloning suara Anda sendiri dan menyediakan kepada orang lain dengan tarif dasar 0,02 dolar per menit.
Profesor ekonomi Bouke Klein Teeselink dari King’s College London mengatakan bahwa pekerjaan pelatihan AI adalah kategori pekerjaan yang baru muncul dan akan tumbuh pesat.
Perusahaan AI mengetahui bahwa membayar orang untuk izin data membantu menghindari sengketa hak cipta yang mungkin muncul dari ketergantungan sepenuhnya pada pengambilan konten dari internet, kata Teeselink. Peneliti AI Veniamin Veselovsky mengatakan bahwa perusahaan-perusahaan ini juga memerlukan data berkualitas tinggi untuk memodelkan perilaku baru yang ditingkatkan dalam sistem. “Saat ini, data manusia adalah standar emas untuk pengambilan sampel dari distribusi model,” tambah Veselovsky.
Manusia yang menggerakkan mesin ini—terutama orang-orang dari negara berkembang—sering kali memerlukan uang tersebut dan hampir tidak memiliki pilihan lain. Bagi banyak pekerja pelatihan AI, melakukan pekerjaan ini adalah tanggapan praktis terhadap kesenjangan ekonomi. Di negara-negara dengan tingkat pengangguran yang tinggi dan mata uang yang terdevaluasi, menghasilkan dolar sering kali lebih stabil dan lebih menguntungkan daripada pekerjaan lokal. Beberapa orang kesulitan menemukan pekerjaan tingkat pemula dan terpaksa melakukan pelatihan AI untuk kehidupan. Bahkan di negara yang lebih kaya, meningkatnya biaya hidup membuat menjual diri menjadi pilihan finansial yang logis.
Pelatih AI di Cape Town, Louw, dengan jelas menyadari biaya privasi yang terkait. Meskipun pendapatannya tidak stabil dan tidak cukup untuk menutupi semua pengeluaran bulanan, ia bersedia menerima ketentuan ini untuk menghasilkan uang. Ia telah berjuang dengan penyakit sistem saraf selama bertahun-tahun dan tidak dapat menemukan pekerjaan, tetapi uang yang dihasilkan dari pasar data AI (termasuk Kled AI) membantunya mengumpulkan 500 dolar untuk mendaftar di kursus pelatihan spa dan menjadi seorang terapis pijat.
“Sebagai orang Afrika Selatan, menerima dolar lebih berarti daripada yang dibayangkan orang lain,” kata Louw.
Profesor geografi internet di Universitas Oxford dan penulis buku “Feeding the Machine” Mark Graham mengakui bahwa bagi individu di negara berkembang, uang ini mungkin memiliki makna praktis dalam jangka pendek, tetapi ia memperingatkan, “secara struktural, pekerjaan ini tidak stabil, tidak memiliki ruang untuk berkembang, dan sebenarnya merupakan jalan buntu.”
Graham menambahkan bahwa pasar data AI bergantung pada “persaingan untuk menekan upah” dan “permintaan temporer untuk data manusia”. Begitu permintaan ini beralih, “pekerja tidak akan memiliki jaminan apa pun, tidak memiliki keterampilan yang dapat ditransfer, dan tidak memiliki jaringan pengaman.”
Graham menyatakan bahwa satu-satunya pemenang adalah “platform-platform di belahan bumi utara yang mendapatkan semua nilai yang berkelanjutan.”
Sumber gambar: The Guardian
Pelatih AI dari Chicago, Hill, memiliki perasaan campur aduk tentang menjual percakapan ponselnya kepada Neon Mobile. Sekitar 11 jam konten percakapan memberinya 200 dolar, tetapi ia mengatakan bahwa aplikasi ini sering offline dan menunda pembayaran. “Neon selalu terasa mencurigakan bagi saya, tetapi saya tetap menggunakannya hanya untuk mendapatkan uang saku tambahan untuk membayar tagihan,” kata Hill.
Sekarang ia mulai mempertimbangkan kembali apakah uang itu benar-benar semudah itu. September lalu, Neon Mobile offline beberapa minggu setelah diluncurkan, setelah TechCrunch menemukan kerentanan keamanan yang memungkinkan siapa saja mengakses nomor telepon pengguna, rekaman panggilan, dan catatan teks. Hill mengatakan Neon Mobile tidak pernah memberitahunya tentang situasi ini, dan sekarang ia khawatir suaranya akan disalahgunakan di internet.
Jennifer King, peneliti privasi data di Stanford University’s Human-Centered AI Institute, merasa khawatir bahwa pasar data AI tidak jelas tentang bagaimana dan di mana data pengguna akan digunakan. Ia menambahkan bahwa tanpa pemahaman tentang hak-hak mereka dan tanpa kemampuan untuk bernegosiasi, “konsumen menghadapi risiko bahwa data mereka akan digunakan kembali dengan cara yang mereka tidak suka, tidak pahami, atau tidak pernah mereka duga, dan pada saat itu hampir tidak ada cara untuk mendapatkan kembali.”
Ketika para pelatih AI berbagi data di Neon Mobile dan Kled AI, mereka memberikan izin penuh (global, eksklusif, tidak dapat dibatalkan, dapat dialihkan, dan bebas royalti), yang memungkinkan platform untuk menjual, menggunakan, memamerkan, dan menyimpan wajah mereka, bahkan untuk menciptakan karya turunan berdasarkan itu.
Pendiri Kled AI, Avi Patel, mengatakan bahwa perjanjian data perusahaannya akan membatasi penggunaan untuk tujuan pelatihan dan penelitian AI. “Seluruh model bisnis bergantung pada kepercayaan pengguna. Jika kontributor merasa data mereka dapat disalahgunakan, platform tidak dapat beroperasi.” Ia menyatakan bahwa perusahaannya akan memeriksa pembeli sebelum menjual kumpulan data, untuk menghindari bekerja dengan “entitas yang mencurigakan,” seperti industri pornografi, serta lembaga pemerintah yang mereka anggap mungkin menggunakan data dengan cara yang melanggar kepercayaan tersebut.
Neon Mobile tidak menanggapi permintaan komentar.
Profesor hukum di St George’s University, London, Enrico Bonadio, mencatat bahwa ketentuan perjanjian ini memungkinkan platform dan kliennya “untuk melakukan hampir apa saja dengan materi tersebut, secara permanen, tanpa pembayaran tambahan, dan kontributor tidak memiliki cara nyata untuk menarik persetujuan atau merundingkan kembali.”
Risiko yang lebih mengkhawatirkan termasuk: data pelatih yang digunakan untuk membuat pemalsuan mendalam dan penyamaran identitas. Meskipun pasar data mengklaim akan menghilangkan informasi identifikasi dari data sebelum menjualnya (seperti nama dan lokasi), pola biometrik secara inheren sulit untuk dianonimkan dengan cara yang bermakna, tambah Bonadio.
Bahkan jika pelatih AI dapat merundingkan ketentuan perlindungan yang lebih rinci tentang cara penggunaan data, mereka masih mungkin menyesal. Pada tahun 2024, aktor Adam Coy dari New York menjual wajahnya kepada Captions—sebuah perangkat lunak pengeditan video AI, yang sekarang berganti nama menjadi Mirage—dengan harga 1000 dolar. Perjanjiannya menyatakan bahwa identitasnya tidak akan digunakan untuk tujuan politik, tidak akan digunakan untuk mempromosikan alkohol, tembakau, atau konten pornografi, dan durasi izin adalah satu tahun.
Captions tidak menanggapi permintaan komentar.
Tak lama setelah itu, teman-teman Adam mulai membagikan video yang mereka temukan secara online, video yang menampilkan wajah dan suaranya, dengan jumlah tampilan mencapai jutaan. Salah satu video di Instagram menampilkan salinan AI Adam yang menyebut dirinya sebagai “dokter vagina,” mempromosikan suplemen medis yang belum terbukti untuk wanita hamil dan pasca melahirkan.
“Menjelaskan hal ini kepada orang lain membuat saya merasa malu,” kata Coy.
“Kolom komentar sangat aneh, karena mereka menilai penampilan saya, tetapi itu bukan saya sama sekali,” tambah Coy. “Ketika saya membuat keputusan (menjual wajah), pikiran saya adalah bahwa sebagian besar model pasti akan mengambil data dan wajah dari internet, jadi lebih baik dibayar.”
Coy mengatakan bahwa setelah itu ia tidak mengambil pekerjaan data AI lainnya. Ia menyatakan bahwa hanya jika suatu perusahaan menawarkan imbalan yang substansial, barulah ia mempertimbangkan untuk melakukannya lagi.