OpenAI совместно с Paradigm представили EVMbench — бенчмарк для оценки способности ИИ выявлять, исправлять и эксплуатировать уязвимости в смарт-контрактах Ethereum. Инициатива нацелена на усиление безопасности DeFi, где в EVM-сетях заблокировано более $100 млрд.
EVMbench построен на 120 реальных критических уязвимостях из 40 профессиональных аудитов, включая конкурсы Code4rena. Вместо синтетических примеров используются реальные баги, в том числе связанные с платёжной логикой сети Tempo — Layer-1, ориентированной на стейблкоин-переводы. Разработчики сохранили возможность эксплуатации ошибок, одновременно обеспечив корректную компиляцию исправлений.
Тестирование проходит в трёх режимах: обнаружение, исправление и эксплуатация. В режиме exploit моделируются атаки с выводом средств в изолированной среде Anvil с проверкой транзакций и состояния сети. Для воспроизводимости создан Rust-харнесс с детерминированным развёртыванием. Все кейсы основаны на публично раскрытых исторических уязвимостях.
По результатам испытаний GPT-5.3-Codex набрала 72,2% в режиме эксплуатации, тогда как GPT-5 показала 31,9%. При этом OpenAI подчёркивает, что покрытие по обнаружению и исправлению ещё не является исчерпывающим.
Компания также объявила о присоединении Питера Штайнбергера (OpenClaw) для развития агентных систем нового поколения, усиливая направление автономных ИИ-инструментов в разработке и кибербезопасности Web3.
Изучайте больше о мире криптовалют, инвестировании и трейдинге в академии Cryptemic.
EVMbench может стать эталонной моделью для оценки эффективности ИИ в защите смарт-контрактов и снижении системных рисков в экосистеме Ethereum.
- Почему у стейблкоинов есть лимиты переводов и как с ними работать
- BlackRock фиксирует рекордный отток из Bitcoin ETF, институциональные продажи продолжаются
- Mantle: преодоление разрыва между токенизацией и традиционными рынками
- DxSale под ударом: утечка LP-токенов затронула более 1 400 пулов на BNB Chain
- Продажи Bitcoin ETF усилились, институционалы выводят средства

