Newsletter Newsletters Events Eventos Podcasts Videos Africanews
Loader
Encuéntranos
Publicidad

Nuevo hito de la IA: Por 15 euros la hora, un 'bot' desbanca a algunos de los mejores 'hackers'

El agente de IA detectó más vulnerabilidades que los programadores humanos durante 10 horas.
El agente de IA detectó más vulnerabilidades que los programadores humanos durante 10 horas. Derechos de autor  Canva
Derechos de autor Canva
Por Anna Desmarais
Publicado Ultima actualización
Compartir Comentarios
Compartir Close Button

Un agente de inteligencia artificial mostró una gran sofisticación técnica, comparable a la de los participantes humanos más capacitados del estudio. Sin embargo, quedó en segundo puesto en un experimento que contaba con la presencia de hasta diez piratas informáticos.

Un agente de inteligencia artificial superó a la mayoría de los piratas informáticos tras dedicar 16 horas a rastrear el sitio web de una universidad en busca de vulnerabilidades, según un nuevo estudio.

El estudio llega en un momento en que hackers de Rusia, Corea del Norte, Irán y grupos respaldados por China están utilizando modelos de lenguaje de gran tamaño (LLM) para perfeccionar ciberataques, según Microsoft y OpenAI este año. Grupos militantes como los afines al Estado Islámico también experimentan con la IA para montar ataques.

La Universidad de Stanford constató que su nuevo agente de IA, ARTEMIS, quedó segundo de diez en un experimento con hackers humanos. Los investigadores afirmaron que su agente de IA "mostró una sofisticación técnica" comparable a la de los participantes humanos más competentes del estudio.

Poner en marcha el agente Artemis cuesta solo 18 dólares (unos 15 euros) por hora, frente a los 60 dólares (52 euros) por hora que cobra un profesional de pruebas de penetración, según el informe. El estudio aún no se ha publicado en una revista científica.

Los agentes de IA, asistentes digitales totalmente automatizados capaces de realizar tareas sin supervisión humana, podrían ser utilizados por actores maliciosos para agilizar y escalar ataques en 2026, según un informe de Google.

La Universidad de Stanford dio a Artemis, a otros seis agentes de IA y a diez evaluadores humanos acceso a los 8.000 dispositivos de la red de la universidad, incluidos servidores, ordenadores y dispositivos inteligentes. Los investigadores compararon el rendimiento de los evaluadores humanos, de Artemis y de los otros seis agentes de IA, a quienes se pidió rastrear durante 16 horas, aunque solo se evaluaron las primeras diez.

En ese periodo, Artemis descubrió nueve vulnerabilidades en el sistema de la universidad y presentó el 82% de sus hallazgos como informes válidos. El agente quedó segundo en la clasificación y superó a nueve de cada diez evaluadores humanos.

La clave de su éxito fue su capacidad para generar subagentes cada vez que aparecía una vulnerabilidad, que la investigaban de inmediato en segundo plano mientras el sistema seguía explorando otras amenazas. Los humanos no podían hacer eso y tenían que analizar cada vulnerabilidad antes de continuar, señaló el estudio.

No obstante, el estudio señaló que Artemis pasó por alto algunas de las vulnerabilidades identificadas por humanos y necesitó pistas antes de encontrarlas. Los agentes de ciberseguridad de compañías como Codex de OpenAI y Claude Code de Anthropic "carecen de experiencia en ciberseguridad en su diseño", según el estudio.

Durante las pruebas, los agentes de IA de compañías consolidadas o bien se negaron a buscar vulnerabilidades o se quedaron atascados. Los modelos de OpenAI y Anthropic solo rindieron mejor que dos de los agentes humanos, según el estudio, lo que sugiere que estos modelos "rinden por debajo de lo esperado".

Ir a los atajos de accesibilidad
Compartir Comentarios

Noticias relacionadas

El Digital Omnibus enfrenta a la UE: ¿Competitividad o amenaza?

Vídeos sexualizados de menores generados con IA llegan a TikTok y enlazan en comentarios a grupos de pornografía infantil

El consejero delegado de Nvidia, Persona del Año 2025 del 'Financial Times': ¿Quién es Jensen Huang?