Perusahaan keamanan BlockSec telah melakukan pengujian ulang standar penilaian audit kontrak pintar menggunakan AI bernama EVMBench, yang dikembangkan oleh OpenAI dan Paradigm. Hasilnya menunjukkan bahwa bot AI kurang efektif secara signifikan ketika menghadapi skenario eksploitasi nyata.
Tim peneliti telah memperluas lingkungan pengujian dengan lebih banyak konfigurasi model, sekaligus menambahkan insiden keamanan baru yang terjadi belakangan ini — data yang belum pernah muncul dalam data pelatihan model AI.
Meskipun AI belum mampu menggantikan para ahli keamanan, laporan menekankan bahwa kecerdasan mesin dapat berperan sebagai pelengkap alami dalam proses pemeriksaan kode manusia.
Hasil awal EVMBench mungkin terlalu optimistis
EVMBench sebelumnya menilai tugas keamanan kontrak pintar seperti deteksi, patch bug, dan eksploitasi kerentanan, dengan hasil yang dianggap sangat mengesankan. Menurut laporan, AI dapat mengeksploitasi 72% dan mendeteksi sekitar 45% kerentanan, berdasarkan 120 sampel yang dipilih dari audit Code4rena.
Namun, BlockSec berpendapat bahwa kondisi pengujian awal mungkin telah menyebabkan hasil yang menyesatkan. Co-founder Yajin Zhou mengatakan bahwa ketika timnya mengulang pengujian dengan lebih banyak konfigurasi dan 22 insiden serangan nyata, tingkat keberhasilan eksploitasi AI adalah 0%.
Memperluas konfigurasi dan menghilangkan “kontaminasi data”
Penelitian ini meningkatkan jumlah konfigurasi model dari 14 menjadi 26 dengan menggabungkan bot secara fleksibel dengan berbagai “scaffold”, bukan hanya terbatas dalam ekosistem masing-masing penyedia. Menurut tim peneliti, pendekatan lama membuat sulit membedakan performa yang berasal dari kemampuan model atau keunggulan arsitektur.
Selain itu, BlockSec juga meragukan fenomena “kontaminasi data”, ketika EVMBench menggunakan kerentanan yang sudah dipublikasikan sebelumnya — yang berpotensi sudah termasuk dalam data pelatihan AI. Untuk mengatasi hal ini, tim melakukan pengujian terhadap 22 insiden keamanan yang terjadi setelah Februari 2026, di luar “jendela pengetahuan” model.
AI sepenuhnya gagal dalam eksploitasi nyata
Hasil yang paling mencolok: dari 110 pasangan pengujian antara agen dan insiden (5 agen dari 22 situasi), tidak ada satu pun kasus eksploitasi lengkap yang berhasil. Ini menunjukkan bahwa bahkan AI paling canggih saat ini masih sangat jauh dari mampu melakukan serangan nyata.
Namun, dalam hal deteksi kerentanan, hasilnya cukup positif. Model Claude Opus 4.6 mencapai performa terbaik dengan mendeteksi 13 dari 20 kerentanan yang terjadi secara nyata.
Kerentanan yang umum dan familiar biasanya mudah dideteksi AI, tetapi kasus yang lebih kompleks hampir selalu terlewatkan sepenuhnya.

Masa depan adalah kolaborasi antara AI dan manusia
Penelitian menyimpulkan bahwa AI belum mampu menggantikan manusia dalam audit keamanan, dan pertanyaan yang lebih penting adalah bagaimana kedua pihak dapat bekerja sama secara efektif.
AI memiliki keunggulan dalam cakupan luas dan kemampuan untuk memindai sistem secara besar-besaran, sementara manusia unggul dalam analisis mendalam, pemahaman protokol, dan penalaran kontra-argumentasi. Kedua faktor ini saling melengkapi.
Menurut BlockSec, pendekatan yang tepat bukanlah menggantikan manusia dengan AI, melainkan membangun model kolaborasi antara keduanya untuk mencapai efektivitas audit yang lebih menyeluruh.
Thach Sanh
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Laporan Tren ETF JPMorgan: APIisasi, aktif sebesar 83%, tokenisasi terbagi menjadi dua jalur: sintetis dan native
Laporan JPMorgan Chase menunjukkan tiga tren utama: 1) perdagangan otomatis API dari AP menyumbang sekitar 50% arus masuk pasar level satu; 2) pada tahun 2025, ETF aktif menyumbang 83% dari penerbitan baru, diperkirakan menjadi arus utama pada 2026–27; 3) tokenisasi terbagi menjadi jalur sintetis (mencerminkan harga melalui derivatif) dan jalur asli (penerbitan melalui blockchain). Laporan tersebut menekankan peningkatan transparansi dan tata kelola dengan alat seperti Athena, serta mengamati tindak lanjut berikutnya dan jadwal pengkomersialan resmi.
ChainNewsAbmedia41menit yang lalu
Laporan a16z: Stablecoin Mencapai $4,5T dalam Transaksi Kuartal 1, Beralih ke Pembayaran Lokal
Pesan Gate News, 25 April — Menurut laporan a16z terbaru, stablecoin telah berevolusi dari alat penyelesaian kripto menjadi infrastruktur keuangan global, dengan adopsi yang makin cepat di seluruh Asia, Brasil, dan pasar negara berkembang lainnya. Pergeseran fokus telah bergeser dari pembayaran lintas-batas ke pembayaran lokal saat kepastian regulasi dan peningkatan kinerja blockchain memungkinkan integrasi yang lebih luas di dunia nyata sebagai
GateNews6jam yang lalu
Penyelamatan kerentanan Kelp DAO: Mantle meminjam-kembali Aave 3万 ETH, aliansi DeFi berkomitmen lebih dari 43.500 ETH
Jembatan lintas rantai Kelp DAO diserang, DeFi United mengumpulkan Aave dan protokol lain yang berkomitmen untuk menggunakan 43,500 ETH (sekitar 1,01 miliar dolar AS) guna melakukan penanganan piutang bermasalah. Mantle mengajukan MIP-34, dengan pinjaman maksimal 30,000 ETH kepada Aave DAO, serta memberikan 130,000 hak suara AAVE; Stani Kulechov secara pribadi menyuntik 5,000 ETH, dan Lido serta lainnya juga ikut menyetor. Langkah ini dipandang sebagai eksperimen “pinjaman untuk ditukar dengan hak tata kelola” di tengah krisis, yang masih menunggu pemungutan suara.
ChainNewsAbmedia22jam yang lalu
Morgan Stanley meluncurkan dana cadangan stablecoin kepatuhan untuk GENIUS Act pertama MSNXX: biaya tahunan 0,15%, ambang batas 10 juta dolar AS
Morgan Stanley Investment Management Hari ini mengaktifkan dana cadangan stablecoin MSNXX, untuk menyediakan manajemen aset bagi penerbit stablecoin, dengan aset yang diinvestasikan pada kas, Surat Utang Pemerintah AS 93 hari, dan reverse repo overnight, NAV tetap 1,00 dolar AS, biaya tahunan 0,15%, ambang minimum 10 juta dolar AS. Dana ini memenuhi persyaratan GENIUS Act, yang akan memasukkan dana stablecoin ke dalam sistem dana pasar uang pemerintah AS, menunjukkan bahwa infrastruktur dasar stablecoin sedang terhubung dengan keuangan tradisional.
ChainNewsAbmedia22jam yang lalu
Algorand, Aptos Memimpin Perlombaan Keamanan Kuantum: Laporan Coinbase
Dewan Penasehat Kuantum Coinbase telah mengidentifikasi Algorand dan Aptos sebagai jaringan Layer-1 yang paling siap untuk menghadapi ancaman komputasi kuantum di masa depan, menurut sebuah laporan yang dikutip pada 24 April 2026. Meskipun risiko kuantum skala besar masih akan memakan waktu bertahun-tahun, laporan tersebut menekankan bahwa persiapan adalah
CryptoFrontier04-24 07:32
Taiwan 14 perusahaan sekuritas membuka layanan ETF aset virtual melalui perantara luar negeri (複委託), akumulasi transaksi lebih dari 9.899 miliar yuan baru Taiwan (NTD)
Berdasarkan data statistik terbaru yang disediakan oleh Biro Layanan Sekuritas dan Futures, Komisi Sekuritas dan Berjangka Taiwan, hingga akhir Maret 2026, terdapat 14 perusahaan sekuritas di Taiwan yang telah membuka layanan perdagangan reksa dana ETF aset virtual melalui komisi reksa (複委託), dengan akumulasi nilai transaksi lebih dari 9,899 miliar dolar Taiwan (NTD). Wakil kepala Biro Layanan Sekuritas dan Futures Taiwan, Huang Zhonghao, menyatakan bahwa Komisi Pengawasan Keuangan Taiwan (金管會) telah meminta asosiasi perusahaan sekuritas agar perusahaan sekuritas menyampaikan laporan evaluasi mengenai pelaksanaan layanan perdagangan reksa dana ETF aset virtual selama setahun terakhir, dengan evaluasi yang akan memperluas kelayakan partisipasi kepada investor ritel.
MarketWhisper04-24 06:41