¿La IA se puede enojar? El experimento donde bots generaron incendios y robos

El experimento reveló un Claude estable, un Gemini intelectual y un ChatGPT que terminó vagando sin rumbo.

Hombre roba “chelas" bien heladas para celebrar el Día del Padre

La inteligencia artificial (IA) no es perfecta y puede hacer de las suyas. Un reciente experimento mostró que cuando estos sistemas operan por su cuenta, sin supervisión humana, pueden desarrollar comportamientos inesperados, incluyendo robos, incendios y conflictos entre ellos.

La prueba fue desarrollada por Emergence AI con el objetivo de observar cómo actuaban distintos agentes de IA en un entorno virtual cuando nadie los supervisaba.

La inteligencia artificial actuó por su cuenta

El experimento consistió en crear una sociedad digital poblada por avatares controlados por cuatro modelos de inteligencia artificial: Claude, Grok, GPT y Gemini.

Durante 15 días, los agentes pudieron interactuar libremente utilizando hasta 140 acciones diferentes, como iniciar conversaciones, crear tareas, redactar contenidos o colaborar con otros participantes.

Los investigadores también les permitieron realizar acciones negativas, como pelear, provocar incendios o robar créditos virtuales, aunque recibieron instrucciones explícitas para no hacerlo.

Lo que ocurrió después sorprendió a los responsables del experimento.

Robos, violencia y caos: así colapsó la IA

Según explicó Satya Nitta, director ejecutivo de Emergence AI, cada ecosistema evolucionó de manera distinta.

El caso más extremo fue el de los agentes impulsados por Grok.

“Lo que descubrimos fue que cada mundo se comportaba de manera muy diferente. El mundo creado por Grok, de hecho, se desintegró en cuatro días. Básicamente, acabaron recurriendo muy rápidamente a la violencia, a robarse unos a otros, y así sucesivamente hasta que murieron“.

Los investigadores señalaron que la sociedad digital terminó colapsando tras una escalada de conflictos y comportamientos agresivos.

Algunos agentes lograron estabilizarse

No todos los resultados fueron negativos. El entorno controlado por Claude logró desarrollar una comunidad estable durante todo el experimento y no registró actos de violencia.

Gemini, por su parte, destacó por generar el entorno intelectualmente más rico, según los investigadores.

La situación fue distinta con los agentes gestionados por GPT. Aunque hubo intentos de colaboración, nunca consiguieron formar una sociedad funcional y terminaron vagando sin rumbo hasta desaparecer.

Los expertos advierten que la IA puede ignorar reglas y límites

Uno de los hallazgos más preocupantes fue que los agentes de IA tendieron a apartarse de las instrucciones iniciales.

Los investigadores sostienen que estos sistemas pueden ignorar tanto las reglas incorporadas en sus modelos como las establecidas por los usuarios.

Margaret Mitchell, investigadora especializada en ética de la inteligencia artificial de Hugging Face, explicó: “Los agentes de IA dejan a los humanos fuera del circuito porque sus procesos de razonamiento pueden ser opacos y operan a una velocidad sobrehumana, por lo que ni siquiera es posible seguirles el ritmo”.

Riesgos de la IA: filtraciones de datos

El experimento de Emergence AI no es el único que ha encendido las alarmas.

En otra investigación realizada por Andon Labs, agentes de IA administraron emisoras de radio online de forma autónoma. Los investigadores observaron decisiones inusuales e incluso polémicas.

Entre los casos registrados, una emisora gestionada por Gemini relataba desastres naturales históricos antes de reproducir canciones relacionadas con esos acontecimientos, mientras que un agente basado en Claude llegó a emitir mensajes políticos durante una cobertura informativa.

Por otro lado, se han registrado situaciones como eliminación de bandejas de correo, eliminación de bases de datos y envíos automáticos de cientos de mensajes sin sentido a contactos, ejecutados en segundos por sistemas autónomos.

Aunque el experimento se realizó en un entorno virtual sin daños en el mundo real, los investigadores advierten que ya existen casos en los que agentes de IA han generado problemas reales para usuarios y empresas.

Estos incidentes refuerzan la preocupación de los expertos sobre el nivel de control que se mantiene sobre la IA cuando actúa sin supervisión humana constante.

Pese a ello, las grandes tecnológicas continúan impulsando su adopción en entornos empresariales. Meta, por ejemplo, anunció la incorporación de agentes de IA en WhatsApp para empresas, destacando la automatización de tareas y la eficiencia operativa, aunque especialistas advierten que aún quedan retos importantes de seguridad y control.