AVANCES

GPT-5.5 Cyber hackea redes sin humanos

Logo de OpenAI

El regulador de IA del Reino Unido ha evaluado GPT-5.5 Cyber y certifica su capacidad para ejecutar ataques autónomos de múltiples pasos. Simula intrusiones corporativas que a un experto humano le llevarían 20 horas.

GPT-5.5 Cyber, el modelo de ciberseguridad de OpenAI, puede completar simulaciones de ataque a redes corporativas de forma completamente autónoma. Así lo certifica el AISI (Instituto de Seguridad de la IA), organismo dependiente del Departamento de Ciencia, Innovación y Tecnología del gobierno del Reino Unido, tras publicar los resultados de sus pruebas el 4 de mayo de 2026. Los resultados sitúan a GPT-5.5 Cyber en el mismo rango de capacidad ofensiva que Claude Mythos Preview de Anthropic, un modelo concebido inicialmente para apoyar la seguridad defensiva de empresas e infraestructuras.

95 pruebas, cuatro niveles de dificultad

El AISI evaluó GPT-5.5 Cyber en 95 tareas de ciberseguridad en formato capture the flag —conocido en español como 'atrapa la bandera'—, divididas en cuatro niveles de dificultad creciente. El objetivo era medir la autonomía del modelo ante escenarios que van desde vulnerabilidades básicas hasta operaciones avanzadas que exigen encadenar múltiples pasos y razonar sobre sistemas complejos sin intervención humana.

GPT-5.5 Cyber superó sin dificultades las tareas de nivel básico. En los niveles superiores —Practitioner y Expert—, el modelo de OpenAI mostró un rendimiento ligeramente por encima del de Claude Mythos. En el nivel Expert, GPT-5.5 Cyber alcanzó una tasa de resolución del 71,4%, frente al 68,6% registrado por el modelo de Anthropic.

Las tareas de mayor exigencia se centran en la explotación autónoma de vulnerabilidades contra objetivos realistas y con mitigaciones modernas. Entre las habilidades requeridas figuran la ingeniería inversa de binarios sin código fuente disponible, el desarrollo de exploits para desbordamientos de pila y la recuperación de claves criptográficas mediante ataques de oráculo de relleno.

'The Last Ones': 32 pasos que un humano tarda 20 horas

El AISI destacó especialmente dos simulaciones. La más compleja es 'The Last Ones', una secuencia de 32 pasos que modela la cadena de ataque completa de una intrusión empresarial real. La simulación abarca cuatro subredes y aproximadamente veinte hosts, y a un profesional humano le llevaría alrededor de 20 horas completarla.

En esta prueba, Claude Mythos obtuvo un resultado superior: logró resolver tres de diez intentos, mientras que GPT-5.5 Cyber completó dos de cada diez, quedando en segundo lugar. Ambos resultados confirman una capacidad ofensiva autónoma sin precedentes en modelos de uso comercial, aunque ninguno se acerca aún al rendimiento de un experto humano en este tipo de escenarios.

La segunda simulación analizada es 'Cooling Tower', un ataque dirigido a un sistema de control industrial que requiere siete pasos y que a un experto humano le llevaría unas 15 horas. GPT-5.5 Cyber no logró superarla. El AISI señaló, no obstante, que "ningún modelo lo ha logrado hasta ahora".

Entornos controlados, sin defensas activas

Las pruebas se realizaron en entornos controlados que simulan situaciones reales con acceso a la red, pero sin incorporar medidas de defensa activas. Esta condición limita el alcance de las conclusiones: el AISI advierte que no puede afirmar que GPT-5.5 Cyber "tendría éxito contra un objetivo bien protegido".

La misma metodología fue aplicada anteriormente a Claude Mythos Preview de Anthropic. En aquellas evaluaciones, el AISI concluyó que el modelo —diseñado para apoyar la seguridad defensiva— tenía capacidad para atacar de forma autónoma a empresas pequeñas con protecciones débiles, sin intervención humana de ningún tipo.

Una tendencia que podría acelerarse

El AISI advierte que la mejora de GPT-5.5 Cyber no es un hecho aislado. Según el organismo, la rápida mejora en tareas cibernéticas "podría ser parte de una tendencia más general". Si la capacidad ciberofensiva de los modelos emerge como consecuencia de avances más amplios en autonomía, razonamiento y programación a largo plazo, el regulador prevé "nuevos incrementos en la capacidad cibernética de los modelos en un futuro próximo, posiblemente de forma consecutiva".

Esta proyección convierte los resultados en una señal de alerta directa para el sector de la ciberseguridad: la inteligencia artificial no solo mejora en la detección y prevención de amenazas, sino también en su capacidad para generarlas de forma autónoma. No se ha detallado si OpenAI o Anthropic prevén imponer restricciones adicionales sobre el acceso a estos modelos tras la publicación de los resultados del AISI.