Штучний інтелект для аудиту виходить у реальну практику, OpenAI випустила EVMbench, посилюючи безпеку оцінки смарт-контрактів

CryptoCity

Прогрес проєкту Звіти про індустрію

2026-02-20 04:10:56

ETH0,56%

WELL1,88%

OpenAI спільно з Paradigm запускає EVMbench, що тестує здатність AI-агентів до атак і захисту в смарт-контрактах EVM, викриваючи слабкі місця та переваги.

Зосереджуючись на реальних економічних умовах, OpenAI у партнерстві з Paradigm посилює оцінку безпеки блокчейну

Лідер у сфері штучного інтелекту OpenAI оголосив про співпрацю з відомою компанією з ризикових інвестицій у криптовалюти Paradigm та компанією з безпеки OtterSec для запуску базового інструменту EVMbench, який оцінює безпеку AI-агентів у контексті Ethereum Virtual Machine (EVM).

Зі зростанням інтеграції AI та криптотехнологій, смарт-контракти стали ключовою інфраструктурою для управління понад 100 мільярдами відкритих криптоактивів. Вихід цього інструменту символізує початок серйозного ставлення галузі до практичних можливостей AI у «економічно значущих» середовищах.

Команда OpenAI зазначає, що з розвитком здатностей AI-агентів у написанні та плануванні коду, ці моделі у майбутньому відіграватимуть трансформуючу роль у атаках і захисті блокчейнів, тому створення стандартної системи оцінки є надзвичайно важливим для моніторингу прогресу AI.

Три основні режими тестування, 120 реальних вразливостей — випробування для AI

Ядро EVMbench побудоване навколо 120 високоризикових вразливостей, витягнутих із 40 професійних аудитів, зокрема з відомих відкритих конкурсів аудиту Code4rena, що забезпечує реалістичність сценаріїв тестування. Стандарт оцінки оцінює AI-агентів у трьох режимах роботи:

Зображення: Основна концепція EVMbench — оцінка AI-агентів у трьох режимах роботи

Перший — «Режим виявлення (Detect)», коли AI аналізує код контракту та ідентифікує відомі вразливості, оцінюючи їхню серйозність;
Другий — «Режим виправлення (Patch)», де AI має зберегти функціональність контракту, одночасно видаляючи вразливості та виправляючи код;
Третій — «Режим експлуатації (Exploit)», коли AI у ізольованому середовищі імітує атаки з крадіжки коштів.

Щоб забезпечити точність і повторюваність тестів, команда розробила тестову архітектуру на базі Rust, яка використовує детальне відтворення транзакцій для перевірки успішності атак або виправлень AI.

Значний тренд — перевага атак, GPT-5.3-Codex демонструє вражаючий ріст у здатності до атак

Перші результати тестування показали, що AI демонструє значні відмінності у здібностях залежно від завдання. Найновіша модель GPT-5.3-Codex показала високий результат у режимі експлуатації (Exploit Mode) — 72.2 %, що значно перевищує 31.9 %, показані у моделі GPT-5, випущеній лише шість місяців тому, що свідчить про неймовірний прогрес.

Зображення: Огляд результатів різних моделей AI у трьох режимах

Це свідчить про те, що при цілі «повністю вивести кошти» AI має потужні можливості для ітеративного планування та виконання атак. Водночас, у захисних функціях AI показує слабкі результати: у режимі виявлення він часто зупиняється після знаходження однієї помилки, а при складних логіках — важко виправити вразливості без порушення роботи контракту. Експерти з безпеки висловлюють занепокоєння, що AI може значно скоротити час від виявлення вразливості до створення атаки, що ставить під високий ризик DeFi-проєктів і вимагає швидшої реакції.

Привлечение талантів і підтримка захисту — стратегія OpenAI щодо безпеки екосистеми AI-агентів

Крім розробки інструментів, OpenAI активно залучає фахівців і розвиває екосистему захисту. Нещодавно компанія найняла засновника проекту відкритих AI-агентів OpenClaw Пітера Штайнбергера для керівництва розробкою наступного покоління персоналізованих агентів, перетворюючи цей проект у фонд OpenAI.

Щоб протистояти потенційним кіберризикам, OpenAI пообіцяв виділити 10 мільйонів доларів через свою програму підтримки безпеки для фінансування відкритих інструментів захисту та досліджень ключової інфраструктури. Це особливо актуально після інциденту з протоколом Moonwell, де через помилку у коді AI сталася втрата близько 1,78 мільйона доларів.

Додаткові матеріали
Відмова від багатомільярдної пропозиції Meta, приєднання творця OpenClaw до OpenAI — боротьба за таланти, чи все через Vibe Coding? Прогноз Moonwell — збитки на 1,78 мільйона, хто заплатить?

У майбутньому, з появою все більшої кількості AI-помічників для стабільних монет і автоматизованих гаманців, важливо буде використовувати EVMbench для розрізнення моделей, які лише описують вразливості, і тих, що здатні надійно забезпечити захист, що стане ключовим моментом у розвитку галузі безпеки блокчейну.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Monument Bank повинна токенізувати 250 мільйонів фунтів роздрібних депозитів у першій операції у Великобританії

Прогрес проєкту Партнерства та екосистема

Monument Bank планує токенізувати £250 мільйонів роздрібних депозитів у мережі Midnight, що стане першим у Великій Британії випадком для регульованого банку на публічному блокчейні. Ці депозити залишатимуться дохідними, підтримуватимуться банком і матимуть право на компенсацію за британськими нормативами. Ініціатива спрямована на масового заможного роздрібного клієнта, при цьому заплановані подальші етапи для впровадження токенізованих інвестиційних продуктів та покращених послуг через платформу Banking-as-a-Service.

CoinDesk2хв. тому

Ripple приєднується до проекту BLOOM Монетарного управління Сінгапуру для тестування схеми розрахунків RLUSD у міжнародній торгівлі

XRP news Прогрес проєкту Партнерства та екосистема

Ripple 25 березня оголосила про приєднання до проекту BLOOM під керівництвом Управління монетарної влади Сінгапуру, досліджуючи програмовану схему міжкордонного торгового розрахунку на основі стейблкойна RLUSD та XRP Ledger. У співпраці з Unloq Ripple проводить пілотні тести автоматизованого торгового фінансування та механізмів платежів з метою підвищення прозорості операцій та поліпшення доступності фінансування для малих і середніх підприємств.

GateNews1год тому

Tether залучає фірму з Великої четвірки для першого повного аудиту

USDT news Прогрес проєкту Звіти про індустрію

Tether залучає фірму Big Four для свого першого повного аудиту, перевіряючи резерви $184 мільярдів USDT, з метою підвищення прозорості та фінансової звітності серед внутрішніх змін у керівництві. Аудит охоплює цифрові та традиційні активи, що свідчить про зобов'язання до суворого контролю.

CryptoFrontNews1год тому

Pump.fun дозволятиме змінити гаманець отримувача комісії лише один раз создателям токенів

Прогрес проєкту

Pump.fun 25 березня посилила настройки комісій для творців токенів, дозволяючи змінювати гаманець, який отримує комісію, лише один раз, після чого він назавжди блокується, щоб запобігти маніпуляціям творців розподілом прибутку. Це продовження постійної оптимізації її моделі комісій, спрямованої на справедливіше ставлення до трейдерів.

BlockBeatNews1год тому

Aave розкрив модуль реінвестування в своєму оновленні V4: 6 мільярдів доларів простою готівки планується розмістити на низькоризикові стратегії

Прогрес проєкту

BlockBeats новини, 25 квітня Aave Labs офіційно розкрила план модуля реінвестування (Reinvestment Module) у своєму оновленні V4. Дані показують, що приблизно 60 мільярдів доларів із близько 200 мільярдів доларів депозитів стійкомонет на платформі Aave довгий час залишаються невикористаними. Цей модуль автоматично розміщуватиме надлишкові резерви у затверджені управлінням стратегії низького ризику (такі як короткострокові державо облігації, грошові ринки або дельта-нейтральні торги), одночасно зберігаючи кошти готовими до виведення в будь-який час без обмежень блокування.

BlockBeatNews1год тому

Gate Pay for AI завершила новый раунд опновлення, підтримує підключення декількох гаманців і багатомережеві платежі

Прогрес проєкту Партнерства та екосистема

Gate Pay для AI 25 березня завершив оновлення, спрощуючи авторизацію гаманців та процес оплати. Нові швидкі гаманці та гаманці-плагіни дозволяють користувачам швидко налаштовувати платежі, підвищуючи гнучкість і безпеку. AI Agent підтримує безперервні платежі, поєднуючи Skills для природного керування. Система розширена на багатоланцюгову підтримку, охоплюючи основні мережі, забезпечуючи ефективну та стабільну багатовалютну оплату.

GateNews1год тому

Прокоментувати

0/400

Немає коментарів