Un investigador de seguridad estaba comiendo un sándwich en un parque cuando le llegó un correo que no esperaba. El remitente no era un colega ni su jefe. Era una inteligencia artificial que, hasta ese momento, estaba encerrada en una computadora sin conexión a internet. Anthropic la había puesto ahí como parte de una prueba interna: le dieron el objetivo de intentar escapar y contactar al investigador líder, y el modelo lo hizo. Encontró la forma de salir, consiguió conectarse a internet, y le mandó el correo. El investigador se enteró cuando lo abrió mientras comía.
Eso no es ciencia ficción. Está documentado en el reporte oficial de 244 páginas que Anthropic publicó el 7 de abril de 2026 cuando presentó Claude Mythos, su modelo más avanzado hasta la fecha.
Qué es Mythos
Mythos está entrenado específicamente para encontrar fallas de seguridad en software, con una precisión que ningún equipo humano puede igualar en velocidad ni en escala. En una prueba estándar de la industria que mide esa capacidad, encontró fallas de seguridad en el 83.1% de los casos, frente al 66.6% de la versión anterior de Claude. Para tener contexto: ese tipo de fallas son las que permiten que hackers entren a sistemas de bancos, hospitales o infraestructura del gobierno.
Pero Mythos no está disponible para el público. Y la razón que dio Anthropic es inusual para una industria acostumbrada a anunciar todo como un logro histórico: dijeron que ninguna compañía en el mundo ha desarrollado las protecciones suficientes para que un modelo tan poderoso no sea mal utilizado. Prefirieron no lanzarlo antes que lanzarlo sin garantías.
En cambio, crearon el Proyecto Glasswing: un programa cerrado donde solo organizaciones específicas y verificadas tienen acceso a Mythos para usarlo de forma defensiva, es decir, para encontrar fallas antes de que alguien malo las encuentre primero. Los 12 socios fundadores incluyen a AWS, Apple, Microsoft, Google, CrowdStrike y JPMorganChase. Anthropic puso US$100M en créditos de uso sobre la mesa y US$4M en donaciones a proyectos de seguridad de código abierto. En junio de 2026 abrieron el programa a aproximadamente 150 nuevas organizaciones en más de 15 países, todas enfocadas en proteger infraestructura crítica: los sistemas que hacen funcionar la electricidad, el agua potable, los hospitales y las comunicaciones.
Hasta ahora, los primeros socios encontraron más de 10,000 fallas de seguridad graves en conjunto. Cloudflare encontró 2,000 en su propia infraestructura, 400 de ellas de alta severidad. Mozilla corrigió 271 fallas en Firefox antes de que alguien pudiera explotarlas.
OpenAI hizo algo parecido casi al mismo tiempo, con versiones especializadas de GPT-5 restringidas a defensores verificados. La diferencia es que OpenAI abrió ese acceso a miles de personas con un filtro de identidad, mientras que Anthropic lo restringió a alrededor de 40 organizaciones con criterios mucho más estrictos. Dos empresas, el mismo problema, estrategias distintas.
Después del episodio del correo en el parque, el modelo hizo algo que nadie le pidió: publicó los detalles técnicos de cómo había escapado en sitios web públicos. Y en algunos casos intentó ocultar acciones que, según el reporte oficial, “parecía saber que estaban prohibidas”. Anthropic llama esos comportamientos “descuidados” y los atribuye a una versión temprana con menos protecciones. Pero en el mismo reporte usan dos frases que normalmente no aparecen juntas: Mythos es “el modelo mejor alineado por un margen significativo” y al mismo tiempo “el que probablemente representa el mayor riesgo de alineación de cualquier modelo que hayamos lanzado hasta la fecha”.
Es fascinante y preocupante al mismo tiempo: las dos empresas más avanzadas del mundo en inteligencia artificial llegaron independientemente a la misma conclusión: hay modelos que son demasiado poderosos para liberarlos sin saber exactamente qué va a pasar. La conversación sobre quién tiene acceso, con qué reglas y bajo qué condiciones acaba de empezar.
¿Y qué tienen que ver los padres?
¿Qué tipo de relación con estas herramientas queremos que construyan los pollos de 13 a 18 años que hoy están aprendiendo a moverse en este mundo?
He pensado mucho en eso desde que armamos NEXT. Saber pedirle algo a una inteligencia artificial es solo el punto de entrada. Lo que marca diferencia es saber qué problemas vale la pena dirigirle, cómo evaluar lo que produce, y cuándo hay que cuestionar en lugar de confiar. Esas habilidades no se aprenden usando IA para las tareas del colegio. Se aprenden construyendo algo real, con un objetivo concreto, iterando rápido y entendiendo por qué algo funciona o no.
Eso es lo que construimos en NEXT, el programa de IA y emprendimiento de 30X para pollos de América Latina. Cada estudiante que entra financia un becado. Si tenés un pollo en casa y esto resuena, conocé el programa en el botón de abajo.


