La herramienta de IA, Sybil, no solo detectó una vulnerabilidad en los sistemas de un cliente, sino que lo hizo mediante un razonamiento técnico tan profundo que dejó boquiabiertos a sus creadores.
Sybil utiliza una arquitectura de modelos combinados y técnicas propias para escanear infraestructuras.
En este caso específico, identificó un fallo crítico en la implementación de GraphQL federado.
IA encontrando vulnerabilidades
El problema exponía información confidencial y requería comprender interacciones complejas entre múltiples sistemas, un nivel de detalle que no se encontraba documentado en ninguna base de datos de vulnerabilidades conocida.
«Buscamos en internet y no existía. Fue un cambio radical en cuanto a las capacidades de los modelos», afirma Herbert-Voss.
Este fenómeno no es aislado. Según Dawn Song, experta de la Universidad de Berkeley, estamos ante un punto de inflexión.
¿Qué sigue?
El auge de la IA agéntica, capaz de ejecutar herramientas y navegar por la web, y el razonamiento simulado, han disparado las capacidades ofensivas de los modelos.
La progresión es evidente en métricas de referencia como CyberGym:
-
Julio 2025: Claude 3.5 Sonnet detectaba el 20 % de las vulnerabilidades.
-
Octubre 2025: El nuevo modelo Claude 4.5 alcanzó el 30 %.
Soluciones como escudo
La capacidad de encontrar ataques de «día cero» a bajo costo es una moneda de dos caras. Mientras RunSybil lo usa para proteger, los mismos modelos pueden generar código malicioso.
Ante esto, Song propone dos estrategias:
-
Que las empresas de IA entreguen sus modelos a investigadores de seguridad antes del lanzamiento público.
-
Utilizar la IA para reescribir el software de forma intrínsecamente más resistente que el código humano actual.
Por ende, a medida que la IA acelera las acciones ofensivas, la única opción para los defensores es convertir a esta misma tecnología en su principal escudo.
Información de Wired / Redacción Noti AI
No dejes de leer: Estudio revela que la IA falla al analizar poemas y evade filtros de seguridad
