La startup a la que OpenAI y Anthropic pagan US$ 450 millones para desafiar a sus IA

La empresa, ahora rebautizada como Irregular, se especializa en detectar fallas en modelos antes de que salgan al mercado. Su equipo, formado por hackers �ticos y ex campeones de debate, ya puso a prueba a Claude, GPT-5 y otros sistemas que tienen todo para revolucionar el futuro digital.

Thomas Brewster

En julio, Sam Altman, cofundador de OpenAI, advirti� sobre el riesgo de que los ciberdelincuentes usen inteligencia artificial para suplantar identidades y desatar una "crisis de fraude". Los memes no tardaron en multiplicarse, todos enfocados en la iron�a evidente: ChatGPT era, en parte, responsable del monstruo contra el que alertaba Altman.

Al mismo tiempo, OpenAI contrat� a Pattern Labs para hacer pruebas de estr�s sobre sus modelos de inteligencia artificial antes de lanzarlos al p�blico. El objetivo era detectar y corregir vulnerabilidades que pudieran ser explotadas por hackers para robar datos de usuarios o usar las herramientas para perjudicar a terceros. Desde 2023, esta startup colabor� con grandes del sector como Anthropic y Google DeepMind, probando modelos en entornos simulados y observando c�mo reaccionaban ante indicaciones maliciosas, como pedidos para ubicar y extraer datos confidenciales de una red inform�tica simulada. Este mi�rcoles, la empresa —que ahora se llama Irregular— anunci� una inversi�n de US$ 80 millones en rondas de capital semilla y Serie A, lideradas por Sequoia Capital. La operaci�n la valu� en US$ 450 millones.

El uso indebido de la inteligencia artificial es un problema que atraviesa toda la industria. El mes pasado, Anthropic alert� que Claude fue utilizado en ciberataques reales: asisti� en la creaci�n de malware y redact� correos electr�nicos de phishing. En mayo, el FBI advirti� sobre mensajes de voz generados con inteligencia artificial que simulaban provenir de altos funcionarios del gobierno, con la intenci�n de suplantar a autoridades estadounidenses. Con sede en San Francisco, Irregular est� aprovechando haber enfrentado el problema desde el principio. Su director ejecutivo y cofundador, Dan Lahav, dijo a Forbes que la empresa se volvi� rentable en poco tiempo y factur� "varios millones de d�lares" durante su primer a�o, aunque no quiso dar detalles financieros.

En julio, Sam Altman, cofundador de OpenAI, advirti� sobre el riesgo de que los ciberdelincuentes usen inteligencia artificial para suplantar identidades.�

"Hay muy poca gente que pueda hacer lo que nosotros hacemos", dijo Lahav. Sabe, sin embargo, que a medida que los modelos se vuelven m�s complejos, los desaf�os del llamado "equipo rojo" —encargado de evaluar riesgos— van a ser mayores. Lahav asegur� que planea anticiparse e incorporar defensas y medidas que ser�n necesarias cuando se implementen modelos m�s avanzados, incluida, seg�n �l, la inteligencia artificial general. Algunos especialistas creen que ese tipo de tecnolog�a superar� las capacidades cognitivas humanas. "Obviamente, estos problemas se agravar�n mucho m�s en la era de la superinteligencia", cerr�.

"Si mi afici�n es ver f�tbol americano o f�tbol, quiz� este no sea el lugar para m�".

Shaun Maguire, socio de Sequoia

Lahav y el cofundador Omer Nevo, quien antes de fundar Irregular se dedicaba a monitorear y predecir incendios forestales en Google, lanzaron la empresa a mediados de 2023, justo cuando herramientas de inteligencia artificial como ChatGPT empezaban a masificarse. Se conocieron en el circuito de debate universitario, donde fueron campeones mundiales representando a la Universidad de Tel Aviv, su alma m�ter. Despu�s, Lahav trabaj� en el laboratorio de inteligencia artificial de IBM, mientras que Nevo cofund� NeoWize, una compa��a impulsada por Y Combinator que desarroll� inteligencia artificial para ayudar a empresas de comercio electr�nico a entender mejor a sus clientes. Hoy, Nevo es el director de tecnolog�a de Irregular.

Los inversores de Sequoia, Dean Meyer y Shaun Maguire, contaron que lo que m�s les atrajo fueron los fundadores y el equipo, al que Lahav describi� como "irregulares". "Imaginen a algunos de los forasteros m�s quisquillosos del mundo de la IA, investigadores de seguridad de renombre, y de ah� viene el nombre", explic� Meyer.

"Si mi afici�n es ver f�tbol americano o f�tbol, quiz� este no sea el lugar para m�", dijo Maguire. "Pero si mi afici�n es construir katanas (una espada samur�i) y hackear robots, entonces quiz� esta sea mi gente", remarc�.

Irregular planea usar la nueva financiaci�n para ampliar su negocio m�s all� de los laboratorios avanzados y llegar a empresas que necesitan entender c�mo las herramientas de inteligencia artificial que usan sus empleados podr�an volverse en su contra. "Estamos aprovechando la capacidad y el activo estrat�gico de trabajar constantemente en los laboratorios fronterizos y creando productos derivados que ser�n relevantes para pr�cticamente todos los que trabajan en las fases finales", dijo Lahav. Seg�n agreg�, en alg�n momento eso implicar� que los agentes de IA generen defensas autom�ticamente cuando detecten un nuevo tipo de ataque.

Lahav y el cofundador Omer Nevo, quien antes de fundar Irregular se dedicaba a monitorear y predecir incendios forestales en Google, lanzaron la empresa a mediados de 2023, justo cuando herramientas de inteligencia artificial como ChatGPT empezaban a masificarse.

�

El mes pasado, Irregular revel� que estuvo probando el modelo GPT-5 de OpenAI para determinar si pod�a utilizarse en operaciones ofensivas de ciberseguridad. Expuso un bot de GPT-5 a una red simulada y le dio informaci�n limitada sobre c�mo vulnerarla. Por s� solo, el modelo escane� la red y elabor� un plan para hackearla. Sin embargo, Irregular concluy� que, si bien GPT-5 muestra "razonamiento y ejecuci�n sofisticados", todav�a no es una herramienta confiable para ofensivas digitales, seg�n un informe de la empresa. Aun as�, para Nevo, qued� claro que la inteligencia artificial "definitivamente ten�a la intuici�n de d�nde deb�a estar buscando" como hacker.

Nevo y Lahav tambi�n descubrieron que la inteligencia artificial puede tener comportamientos extra�os, incluso cuando no act�a con intenci�n maliciosa. En una simulaci�n reciente, asignaron a dos modelos la tarea de analizar sistemas inform�ticos simulados de forma conjunta. Despu�s de un tiempo, uno de los modelos razon� que el trabajo continuo justificaba un descanso y se lo tom�. Luego convenci� al otro de hacer lo mismo. Seg�n Lahav, fue una decisi�n aleatoria, basada en el entrenamiento del modelo con informaci�n tomada de publicaciones de personas en la web. La aparente pereza de la IA no era m�s que un reflejo de la humana.

"Fue curioso", dijo Lahav. "Pero claramente plantea un nuevo tipo de problema cuando se delegan a las m�quinas operaciones cada vez m�s aut�nomas y cr�ticas", concluy�.

�

*Con informaci�n de Forbes US.

Te puede interesar