BlockSec: AI chưa thể thay thế con người trong kiểm toán smart contract

TapChiBitcoin

Công ty bảo mật BlockSec đã tiến hành kiểm tra lại bộ tiêu chuẩn đánh giá kiểm toán smart contract bằng AI mang tên EVMBench, do OpenAI và Paradigm phát triển. Kết quả cho thấy các bot AI kém hiệu quả hơn đáng kể khi đối mặt với các kịch bản khai thác thực tế.

Nhóm nghiên cứu đã mở rộng môi trường thử nghiệm với nhiều cấu hình mô hình hơn, đồng thời bổ sung các sự cố bảo mật mới xảy ra gần đây — những dữ liệu chưa từng xuất hiện trong tập huấn luyện của các mô hình AI.

Dù AI vẫn chưa thể thay thế các chuyên gia bảo mật, báo cáo nhấn mạnh rằng trí tuệ máy móc có thể đóng vai trò bổ trợ tự nhiên cho quá trình kiểm tra mã của con người.

Kết quả EVMBench ban đầu có thể quá lạc quan

EVMBench trước đó đánh giá các tác vụ bảo mật smart contract như phát hiện, vá lỗi và khai thác lỗ hổng, với kết quả được xem là rất ấn tượng. Theo báo cáo, AI có thể khai thác 72% và phát hiện khoảng 45% lỗ hổng, dựa trên 120 mẫu được chọn lọc từ các cuộc kiểm toán của Code4rena.

Tuy nhiên, BlockSec cho rằng điều kiện thử nghiệm ban đầu có thể đã làm sai lệch kết quả. Đồng sáng lập Yajin Zhou cho biết khi nhóm của ông thử nghiệm lại với nhiều cấu hình hơn và 22 sự cố tấn công thực tế, tỷ lệ khai thác thành công của AI là 0%.

Mở rộng cấu hình và loại bỏ “ô nhiễm dữ liệu”

Nghiên cứu đã tăng số cấu hình mô hình từ 14 lên 26 bằng cách kết hợp linh hoạt các bot với nhiều “scaffold” khác nhau, thay vì chỉ giới hạn trong hệ sinh thái của từng nhà cung cấp. Theo nhóm nghiên cứu, cách làm cũ khiến khó phân biệt hiệu suất đến từ năng lực mô hình hay lợi thế kiến trúc.

Ngoài ra, BlockSec cũng đặt nghi vấn về hiện tượng “ô nhiễm dữ liệu”, khi EVMBench sử dụng các lỗ hổng đã được công bố trước đó — có khả năng đã nằm trong dữ liệu huấn luyện của AI. Để khắc phục, nhóm đã thử nghiệm trên 22 sự cố bảo mật xảy ra sau tháng 2/2026, nằm ngoài “cửa sổ kiến thức” của các mô hình.

AI thất bại hoàn toàn trong khai thác thực tế

Kết quả đáng chú ý nhất: trong 110 cặp thử nghiệm giữa agent và sự cố (5 agent trên 22 tình huống), không có bất kỳ trường hợp khai thác hoàn chỉnh nào thành công. Điều này cho thấy ngay cả các AI tiên tiến nhất hiện nay vẫn còn rất xa mới có thể thực hiện tấn công thực tế.

Tuy vậy, ở mảng phát hiện lỗ hổng, kết quả vẫn tương đối tích cực. Mô hình Claude Opus 4.6 đạt hiệu suất tốt nhất khi phát hiện 13/20 lỗ hổng trong thực tế.

Các lỗ hổng phổ biến, quen thuộc thường được AI phát hiện dễ dàng, nhưng những trường hợp phức tạp hơn thì gần như bị bỏ sót hoàn toàn.

Tương lai là hợp tác giữa AI và con người

Nghiên cứu kết luận rằng AI chưa thể thay thế con người trong kiểm toán bảo mật, và câu hỏi quan trọng hơn là cách hai bên phối hợp hiệu quả.

AI có lợi thế về độ bao phủ và khả năng quét hệ thống quy mô lớn, trong khi con người vượt trội ở tư duy phân tích sâu, hiểu biết giao thức và suy luận đối kháng. Hai yếu tố này mang tính bổ trợ lẫn nhau.

Theo BlockSec, hướng đi đúng đắn không phải là thay thế con người bằng AI, mà là xây dựng mô hình hợp tác giữa hai bên để đạt hiệu quả kiểm toán toàn diện hơn.

Thạch Sanh

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Fireblocks' 30 Web3 Partners Manage Over $200B in Monthly Stablecoin Flows

Tin tức từ Gate, ngày 26 tháng 4 — Fireblocks, một nền tảng chuyển giao tài sản cấp tổ chức hàng đầu, vận hành một mạng lưới gồm 30 đối tác kinh doanh Web3 trải dài qua các giao thức DeFi, thanh toán đối soát, phân tích tuân thủ, các tổ chức giao dịch và hạ tầng đa chuỗi. Hệ sinh thái hợp tác được tổ chức

GateNews4giờ trước

Doanh thu Q1 của Moore Threads tăng vọt 155% so với cùng kỳ năm trước lên 104 triệu USD, chuyển sang có lãi

Tin tức từ cổng thông tin, ngày 26 tháng 4 — Moore Threads công bố doanh thu quý 1 năm 2026 đạt 738 triệu nhân dân tệ (xấp xỉ $104 triệu), tương ứng tăng 155,35% so với cùng kỳ năm trước. Công ty đã chuyển từ thua lỗ sang có lãi với lợi nhuận ròng 29,36 triệu nhân dân tệ, so với mức lỗ 112 triệu nhân dân tệ trong kỳ sa

GateNews5giờ trước

Tiền ổn định không chỉ thanh toán xuyên biên giới, mà còn được bản địa hóa! Báo cáo mới nhất của a16z: Châu Á chiếm 2/3 khối lượng giao dịch

Tập đoàn đầu tư mạo hiểm tiền mã hóa a16z mới đây đã phát hành báo cáo “9 charts on what stablecoins are becoming” bằng chín biểu đồ quan trọng, mô tả sự thay đổi mang tính cấu trúc mà stablecoin đang trải qua. Kết luận cốt lõi của báo cáo này không phải là một token hay một câu chuyện mới, mà là vai trò của stablecoin đang chuyển từ “công cụ giao dịch”, “phương tiện lưu trữ” sang “hạ tầng tài chính cốt lõi”, và ngày càng mang tính bản địa, tạo ra sự chênh lệch rõ rệt so với kỳ vọng ban đầu của thị trường về thanh toán xuyên biên giới. Đạo luật GENIUS của Mỹ thúc đẩy khối lượng giao dịch stablecoin lên 4.5 nghìn tỷ USD trong quý 4 Trong nhiều năm qua, sự không chắc chắn về quy định luôn là trần cản trở sự tham gia của các tổ chức vào stablecoin. Điểm ngoặt đến từ việc Đạo luật GENIUS của Mỹ thiết lập khuôn khổ phát hành stablecoin cấp liên bang đầu tiên. Dữ liệu của a16z cho thấy, khối lượng giao dịch stablecoin đã điều chỉnh trước khi dự luật được thông qua đã liên tục trong vài quý

ChainNewsAbmedia5giờ trước

Ngân hàng Trung ương Brazil: Stablecoin chiếm ưu thế trong các giao dịch mua crypto trị giá hơn 6,9 tỷ USD được đăng ký trong Q1

Theo dữ liệu do Ngân hàng Trung ương Brazil công bố, việc mua stablecoin chiếm 6,8 tỷ USD trong tổng số 6,9 tỷ USD tiền điện tử mà người Brazil đã mua ở nước ngoài trong quý 1. Điều này thể hiện mức tăng hơn 100% so với cùng kỳ năm ngoái. Các điểm chính: Ngân hàng Trung ương của Brazil

Coinpedia8giờ trước

Stablecoin nổi lên như hạ tầng tài chính cốt lõi, xu hướng nội địa hóa tăng tốc: Báo cáo a16z

Tin từ Gate, ngày 26 tháng 4 — Theo một báo cáo từ các nhà nghiên cứu crypto của a16z là Robert Hackett và Jeremy Zhang, stablecoin đang phát triển từ các công cụ giao dịch giai đoạn đầu và phương tiện tiết kiệm thành hạ tầng tài chính cốt lõi. Đạo luật GENIUS của Mỹ đã

GateNews14giờ trước

79% máy ATM tiền mã hóa Toàn cầu được đặt tại Hoa Kỳ

Tin tức Cổng thông tin, ngày 25 tháng 4 — Theo Cointelegraph, 79% máy ATM tiền mã hóa trên toàn thế giới được đặt tại Hoa Kỳ.

GateNews22giờ trước
Bình luận
0/400
Không có bình luận