BlockSec: La IA aún no puede reemplazar a los humanos en la auditoría de contratos inteligentes

TapChiBitcoin

La empresa de seguridad BlockSec ha realizado una revisión del estándar de evaluación de auditorías de contratos inteligentes mediante IA llamado EVMBench, desarrollado por OpenAI y Paradigm. Los resultados muestran que los bots de IA son significativamente menos efectivos cuando enfrentan escenarios de explotación reales.

El equipo de investigación amplió el entorno de pruebas con más configuraciones de modelos y añadió incidentes de seguridad recientes, datos que no habían sido vistos en el entrenamiento de los modelos de IA.

Aunque la IA aún no puede reemplazar a los expertos en seguridad, el informe destaca que la inteligencia artificial puede desempeñar un papel complementario natural en el proceso de revisión de código humano.

Los resultados iniciales de EVMBench pueden ser demasiado optimistas

EVMBench evaluó previamente tareas de seguridad en contratos inteligentes como detección, corrección y explotación de vulnerabilidades, con resultados considerados muy impresionantes. Según el informe, la IA puede explotar el 72% y detectar aproximadamente el 45% de las vulnerabilidades, basándose en 120 muestras seleccionadas de auditorías de Code4rena.

Sin embargo, BlockSec sostiene que las condiciones iniciales de las pruebas pudieron haber sesgado los resultados. Yajin Zhou, cofundador, afirmó que al repetir las pruebas con más configuraciones y 22 incidentes de ataque reales, la tasa de éxito en explotación de la IA fue del 0%.

Ampliación de configuraciones y eliminación de “contaminación de datos”

La investigación aumentó el número de configuraciones de modelos de 14 a 26, combinando de manera flexible bots con diferentes “andamios” en lugar de limitarse al ecosistema de cada proveedor. Según el equipo, el método anterior dificultaba distinguir si el rendimiento se debía a la capacidad del modelo o a ventajas arquitectónicas.

Además, BlockSec cuestiona la “contaminación de datos”, ya que EVMBench utilizó vulnerabilidades previamente divulgadas, que podrían haber estado en los datos de entrenamiento de la IA. Para solucionar esto, probaron 22 incidentes de seguridad ocurridos después de febrero de 2026, fuera de la “ventana de conocimiento” de los modelos.

La IA fracasó completamente en explotaciones reales

El resultado más destacado: en 110 pruebas entre agentes y incidentes (5 agentes en 22 situaciones), no hubo ningún caso de explotación completa exitosa. Esto demuestra que incluso las IA más avanzadas aún están lejos de poder realizar ataques en escenarios reales.

Sin embargo, en detección de vulnerabilidades, los resultados siguen siendo relativamente positivos. El modelo Claude Opus 4.6 logró detectar 13 de 20 vulnerabilidades en la práctica.

Las vulnerabilidades comunes y conocidas son fácilmente detectadas por la IA, pero los casos más complejos casi siempre se pasan por alto.

El futuro es la colaboración entre IA y humanos

La investigación concluye que la IA aún no puede reemplazar a los humanos en auditorías de seguridad, y la pregunta más importante es cómo coordinar eficazmente a ambas partes.

La IA tiene ventajas en cobertura y capacidad de escaneo a gran escala, mientras que los humanos sobresalen en análisis profundo, comprensión de protocolos y razonamiento adversarial. Ambos aspectos son complementarios.

Según BlockSec, el camino correcto no es reemplazar a los humanos con IA, sino construir un modelo de colaboración entre ambos para lograr auditorías más completas y efectivas.

Shach Sanh

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Informe de a16z: Las stablecoins alcanzan $4,5 billones en transacciones del 1T, con cambio hacia pagos locales

Mensaje de Gate News, 25 de abril — Según un nuevo informe de a16z, las stablecoins han evolucionado de herramientas de liquidación cripto a infraestructura financiera global, con una adopción que se acelera en Asia, Brasil y otros mercados emergentes. El cambio de enfoque ha pasado del pago transfronterizo a los pagos locales a medida que la claridad regulatoria y el mejor rendimiento de la blockchain permiten una integración más amplia en el mundo real.

GateNewshace4h

Rescate de vulnerabilidad de Kelp DAO: Mantle prepara la versión tokenizada de Aave 3 millones de ETH, el consorcio DeFi promete más de 43.500 ETH

Kelp DAO 跨鏈橋遭駭後,DeFi United 集結 Aave 等協議承諾動用 43,500 ETH(約 1.01 億美金)救濟壞帳。Mantle 提出 MIP-34,最高借出 30,000 ETH 給 Aave DAO,授予 130,000 AAVE 投票權;Stani Kulechov 個人注資 5,000 ETH,Lido 等亦出資。此舉被視為危機下的「貸款換治理權」實驗,尚待投票。

ChainNewsAbmediahace19h

Morgan Stanley lanza el primer fondo de reserva para stablecoins reguladas conforme al GENIUS Act, MSNXX: comisión anual 0.15%, umbral 10,000,000 USD

Morgan Stanley Investment Management hoy activa el fondo de reserva de stablecoin MSNXX, brindando gestión de activos a emisores de stablecoins; los activos se invierten en efectivo, bonos del Tesoro de EE. UU. a 93 días y repos overnight; el NAV es fijo en 1.00 USD, la tarifa anual es del 0.15%, y el umbral mínimo es de 10 millones de dólares. Este fondo cumple con los requisitos de la GENIUS Act, al incorporar los fondos de stablecoin en el sistema de fondos del mercado monetario del gobierno de EE. UU., mostrando que la infraestructura de stablecoin se está alineando con las finanzas tradicionales.

ChainNewsAbmediahace19h

Algorand, Aptos lideran la carrera de seguridad cuántica: informe de Coinbase

El Consejo Asesor de Cuántica de Coinbase ha identificado a Algorand y Aptos como las redes de Capa 1 mejor posicionadas para hacer frente a las amenazas futuras de la computación cuántica, según un informe citado el 24 de abril de 2026. Si bien los riesgos cuánticos a gran escala siguen estando a años de distancia, el informe enfatiza que la preparación es

CryptoFrontier04-24 07:32

Taiwán: 14 casas de valores inician órdenes de corretaje de ETF de activos virtuales, acumulando más de 9.899.000.000 de dólares taiwaneses en operaciones

Según las estadísticas más recientes proporcionadas por la Dirección General de Valores y Futuros de la Comisión de Supervisión Financiera (金管會) de Taiwán, a finales de marzo de 2026, un total de 14 casas de valores en Taiwán ya han puesto en marcha el negocio de subcontratación (複委託) de ETFs de activos virtuales; las operaciones acumuladas superan los 9.899 mil millones de dólares taiwaneses (nuevo dólar taiwanés). El subdirector de la Dirección de Valores y Futuros de Taiwán, Huang Zhonghao (黃仲豪), declaró que la Comisión de Supervisión Financiera de Taiwán (金管會) ha pedido a la asociación de casas de valores que presente un informe de evaluación sobre la ejecución de este negocio de subcontratación de ETFs de activos virtuales durante el año anterior, y que la evaluación extenderá la elegibilidad para participar hasta los inversores minoristas.

MarketWhisper04-24 06:41

Informe de ARK Invest: los compradores de confianza en Bitcoin aumentan su posición en un 69%, el rango de suelo aún no se ha probado

Según el informe trimestral de Bitcoin de ARK Invest para el primer trimestre de 2026, publicado el 24 de abril, las tenencias del «comprador con confianza» de Bitcoin aumentaron de 2,13 millones de monedas a 3,60 millones, un 69% trimestre contra trimestre. El informe de ARK Invest indica que el rango de soporte clave de fondos periódicos (de 54,000 USD a 50,000 USD) definido por la firma no fue probado al cierre del primer trimestre.

MarketWhisper04-24 05:43
Comentar
0/400
Sin comentarios