区块链安全公司BlockSec已对由OpenAI和Paradigm开发的名为EVMBench的智能合约AI审计评估标准进行了重新测试。结果显示,面对实际的攻击场景,AI机器人表现明显不佳。
研究团队扩大了测试环境,增加了更多模型配置,同时加入了近期发生的新的安全事件——这些数据此前未曾出现在AI模型的训练数据中。
虽然AI仍无法取代安全专家,但报告强调,机器智能可以自然地作为人类代码审查的辅助工具。
EVMBench初步结果可能过于乐观
此前,EVMBench评估了智能合约安全任务,如漏洞检测、修复和利用,结果被认为非常令人印象深刻。报告显示,AI在120个经过筛选的Code4rena审计样本中,能成功利用72%,并检测出约45%的漏洞。
然而,BlockSec认为,最初的测试条件可能导致结果偏差。联合创始人周亚金表示,团队在使用更多配置和22个实际攻击事件重新测试后,AI的成功利用率为0%。
扩展配置并排除“数据污染”
研究将模型配置数量从14增加到26,通过灵活组合不同“脚手架”与机器人,而不再局限于各供应商的生态系统。研究团队指出,旧的方法难以区分模型性能是源于模型能力还是架构优势。
此外,BlockSec还质疑“数据污染”现象,即EVMBench使用了已公开的漏洞——这些漏洞可能已包含在AI的训练数据中。为此,团队在2026年2月之后发生的22个安全事件上进行了测试,确保超出模型的“知识窗口”。
AI在实际攻击中完全失败
最引人注目的结果是:在110组代理与漏洞的测试中(5个代理面对22个场景),没有任何一次完整的利用成功。这表明,即使是目前最先进的AI,也距离进行实际攻击还很遥远。
不过,在漏洞检测方面,结果仍相对积极。Claude Opus 4.6模型在实际检测中表现最佳,成功发现了13个中的20个漏洞。
常见、熟悉的漏洞AI较易检测,但更复杂的案例几乎完全被遗漏。

未来是AI与人类的合作
研究得出结论:AI尚不能取代人类进行安全审计,更重要的问题是双方如何高效协作。
AI在覆盖范围和大规模扫描能力方面具有优势,而人类在深度分析、协议理解和对抗推理方面更具优势。这两者相辅相成。
BlockSec认为,正确的方向不是用AI取代人类,而是建立双方合作的模型,以实现更全面的审计效果。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Europe's MiCA Framework Makes Euro Stablecoin 'Safe but Uncompetitive,' Blockchain Association Reports
Gate News message, April 27 — The Blockchain for Europe association released a report on Monday that concludes the European Union's Markets in Crypto-Assets Regulation (MiCA) framework has significantly enhanced the safety of euro stablecoins but simultaneously undermined their commercial
GateNews54 分钟前
从投机走向稳定:Discovery银行报告揭示,已有780万名南非人开始投资加密货币
Discovery Bank 和 Visa 的一份新报告突显了南非金融格局的一项重大变化:随着加密货币从投机趋势走向主流投资类别,其逐渐成熟。
要点:
Discovery Bank 和 Visa 报告称,现有 780 万南非人将加密货币视为一个主流的主st
Coinpedia4小时前
Gate 2026年第一季度报告:Perp DEX交易量达$130B ,TradFi产品推动多资产扩张
Gate 新闻消息,4月27日——Gate发布了其2026年第一季度季度报告,展示其在核心业务板块中的持续扩张。Gate Perp DEX在第一季度进入扩容阶段,累计交易量超过$13 十亿美元,超过1000万笔交易,并扩展至超过600个交易对。除主流加密资产外,该平台还为传统金融大宗商品推出永续合约,包括黄金、白银和原油,使其生态从单一资产加密衍生品扩展为多资产市场。
ETF和衍生品市场表现强劲。ETF季度交易量从年末的$6.7 billion USDT增长至超过十亿美元 USDT,覆盖超过320个交易对。期权交易的日活跃用户增长54.6%,https://www.gate.com/zh/tradfi相关产品推动衍生品增长,并将交易结构向多资产覆盖转变。
机构与产品生态的动能加速。机构合约规模较年末增长超过50%,而机构用户数增长超过66%。管理资产规模增长22%,交易量增长192%。CrossEx的交易量与净资产规模分别实现约9.4倍和3.1倍的增长。Gate凭借多业务协同,利用传统金融与加密资产的融合,正在加速其向综合多资产交易平台的演进。
GateNews4小时前
CoinShares 上周数字资产基金净流入达 12 亿美元,管理资产(AuM)升至 1550 亿
Gate 新闻消息,4月27日——CoinShares 最新每周报告显示,数字资产投资产品上周录得 12 亿美元净流入,连续第四周出现净流入。管理资产 (AuM) 升至 $155 十亿,为 2 月 1 日以来的最高水平,
GateNews5小时前
DeFi United 众筹突破 10.2 万枚 ETH,AAVE 反弹至 100 美元
根据 DeFi United 官方页面,由 Aave 服务提供者主导发起的多协议救济基金 DeFi United,截至 4 月 27 日已募集超过 10.2 万枚 ETH,旨在填补 4 月 18 日 Kelp DAO 跨链桥接攻击事件后 Aave V3 市场产生的坏账缺口。AAVE 短暂突破 100 美元后回落。
Market Whisper8小时前
Hyperliquid 录得 $820M 年收入,在全球永续合约交易量中排名第四
Gate 新闻消息,4月27日——据 Bitcoin Suisse 的一份研究报告,Hyperliquid 在过去12个月内产生了 $820 百万美元的年收入,并在全球永续合约交易量中排名第四,确立了自己作为少数几个
GateNews9小时前