De Open AI a Anthropic
Para los que nos gusta el fútbol, esto es como cuando Figo jugaba en el Barcelona y se fue a jugar al Real Madrid
El 19 de mayo de 2026, Andrej Karpathy publicó en X que se unía al equipo de pre-entrenamiento de Anthropic. En Silicon Valley, ese anuncio tuvo el efecto de una piedra en un lago quieto. Karpathy no es un investigador más: es co-fundador de OpenAI, el mismo laboratorio que Anthropic desafía directamente. Es la persona que construyó el sistema de visión artificial de Tesla Autopilot. Es, para mucha gente en la industria, la voz técnica más confiable de toda la era moderna de la IA.
Que alguien con ese peso específico elija cruzar la calle dice algo indica que, probablemente, ahí en Anthropic es donde está la investigación de tecnología de frontera más interesante ahora mismo, y qué se preguntan quienes tienen la libertad de elegir.
Pero para entender por qué ese movimiento importa, hay que entender quién es Karpathy y qué ha construido a lo largo de los últimos quince años. Su historia está atravesada por la misma pregunta desde ángulos distintos: cómo hacer que los humanos entiendan mejor el mundo que la tecnología está construyendo alrededor de ellos.
De Bratislava a Stanford: el hombre que aprendió a enseñar haciendo
Karpathy nació en Bratislava en 1986 y emigró a Toronto a los 15 años. Estudió ciencias de la computación y física en la Universidad de Toronto, hizo su maestría en UBC trabajando sobre simulación de movimiento físico, y terminó su doctorado en Stanford en 2015 bajo la supervisión de Fei-Fei Li, la investigadora que construyó ImageNet y que cambió para siempre cómo las máquinas aprenden a ver.
Su tesis, Connecting Images and Natural Language, demostró que era posible alinear visión y lenguaje en un mismo espacio matemático, un trabajo que anticipó con años de anticipación la dirección que tomaría toda la industria con los modelos multimodales. Pero lo que más define a Karpathy es lo que hizo mientras simultáneo a escribir el paper.
En 2015, co-diseñó con Fei-Fei Li el curso CS231n: Redes Neuronales Convolucionales para Reconocimiento Visual en Stanford. El primer año lo tomaron 150 estudiantes. El segundo, 350. El tercero, 750. Karpathy lo documentó en X con la etiqueta #aiinterestsingularity, como si ya supiera que lo que estaba pasando en esa sala era la punta de algo mucho más grande. Las notas del curso están disponibles gratuitamente en internet desde entonces y siguen siendo el material de referencia más usado en el mundo para aprender visión computacional profunda.
Ese impulso de enseñar, de hacer que el conocimiento sea accesible a quien no tuvo el privilegio de estar en esa sala de Stanford, no desapareció cuando Karpathy entró al mundo corporativo. Se transformó.
Tesla, el laboratorio más grande del mundo
Cuando Karpathy se unió a Tesla en junio de 2017 como Director de IA y Autopilot Vision, resolvería uno de los problemas de ingeniería más complejos de la historia: hacer que un automóvil entienda el mundo visual con suficiente precisión como para moverse de manera autónoma por él.
Lo que construyó allí es un caso de estudio en cómo escalar inteligencia con restricciones reales. El sistema que diseñó, conocido como HydraNet, usaba un único backbone de red neuronal compartido que alimentaba decenas de algoritmos distintos en paralelo, una arquitectura que permitía a equipos independientes trabajar simultáneamente sin pisarse. Pero el componente más extraordinario fue lo que Karpathy llamó el “motor de datos”: un ciclo semi-supervisado donde la flota de más de un millón de Teslas en circulación identificaba automáticamente los casos difíciles, los etiquetaba y los devolvía al sistema de entrenamiento. El primer conjunto de datos de ese sistema tenía 1,5 petabytes de información y más de seis mil millones de objetos etiquetados.
En 2021, en la conferencia CVPR, anunció que Tesla había eliminado el radar de sus vehículos para depender exclusivamente de visión por cámara, una decisión que generó escepticismo masivo en la industria. Su argumento era que los humanos manejamos con dos ojos y un cerebro, y que el camino correcto era enseñarle a la IA a hacer exactamente eso, con la misma información que usamos nosotros, en lugar de agregarle sensores que los humanos no tenemos. Era una apuesta técnica y filosófica al mismo tiempo.
Salió de Tesla en julio de 2022 sin drama público. Musk lo describió como un honor haberlo tenido en el equipo.
El maestro que nunca dejó de serlo
Entre Tesla y su regreso a OpenAI, Karpathy hizo algo que pocos en su posición habrían hecho: se dedicó a enseñar en internet.
Lanzó en YouTube la serie Neural Networks: Zero to Hero, una colección de clases donde construye desde cero, en código, todos los componentes fundamentales de los modelos de lenguaje modernos. Primero micrograd, un motor de diferenciación automática en doscientas líneas de Python. Luego makemore, un modelo de lenguaje a nivel de carácter. Luego nanoGPT, una réplica funcional de GPT-2 en código limpio y legible. La filosofía detrás de cada video es la misma: el epígrafe que usa para todo su trabajo educativo es una frase de Richard Feynman, “What I cannot create, I do not understand,” y la toma literalmente. Si no construiste la cosa desde cero, con tus propias manos, no la entendés de verdad.
El repositorio nanoGPT en GitHub acumula casi 60.000 estrellas. La clase “Let’s build GPT: from scratch, in code, spelled out” tiene millones de vistas y es probablemente la introducción más honesta y rigurosa a los modelos de lenguaje que existe en formato público.
En noviembre de 2023, después de que lo invitaran a dar una charla en el AI Security Summit, regrabó la presentación en su cuarto de hotel durante el fin de semana de Thanksgiving porque la charla original no había sido grabada y la gente la pedía. La subió como “Intro to Large Language Models”, una hora de video donde explica con claridad inusual qué son los modelos de lenguaje, cómo funcionan y qué implican. Más de un millón de personas la vieron en las primeras semanas.
La visión que lo llevó a fundar Eureka Labs
En julio de 2024, después de salir de OpenAI por segunda vez, Karpathy anunció Eureka Labs con una pregunta que vale citar de cerca: ¿cómo se acerca uno a la experiencia ideal de aprender algo nuevo? Su respuesta fue imaginar a un estudiante trabajando con materiales de altísima calidad acompañado por Feynman en persona, alguien que lo guía en cada paso, que habla todos los idiomas, que tiene paciencia infinita y que entiende exactamente en qué punto del camino está el estudiante.
El problema, reconocía Karpathy con honestidad, es que ese tipo de tutor es escaso por definición. Los expertos que son apasionados, buenos enseñando y capaces de personalizar la experiencia para cada persona no pueden estar con los ocho mil millones de habitantes del planeta al mismo tiempo. La IA, para él, era la manera de resolver esa ecuación.
El producto inicial de Eureka era LLM101n, un curso para aprender a construir un modelo de lenguaje desde cero, con el mismo espíritu de sus videos de YouTube pero estructurado como un programa completo con syllabus, proyectos y materiales progresivos. En octubre de 2025 lanzó nanochat, el proyecto final del curso: un sistema que permite entrenar un clon funcional de ChatGPT desde cero por alrededor de cien dólares en cuatro horas usando hardware en la nube.
Lo que más revela de Karpathy en ese período es lo que dijo sobre los límites actuales de la tecnología para hacer tutorías de IA realmente buenas. Describió a su profesora de coreano, que en pocos minutos de conversación entendió con precisión dónde estaba él como estudiante y ajustó la dificultad en tiempo real. Para él, esa capacidad de diagnóstico pedagógico instantáneo es el estándar real.
Por qué Anthropic, y qué implica eso
Cuando Karpathy anunció su incorporación a Anthropic en mayo de 2026, el contraste más evidente era geográfico y simbólico: venía del laboratorio que creó ChatGPT y se iba al laboratorio que compite más directamente con él. Su mandato en Anthropic es trabajar en pre-entrenamiento, que es el proceso fundamental de enseñarle a un modelo de lenguaje a entender el mundo antes de que sea afinado para tareas específicas. Más específicamente, su objetivo declarado es usar a Claude para acelerar la investigación de pre-entrenamiento, es decir, usar IA para hacer mejor IA.
Escribió en X que los próximos años en la frontera de los modelos de lenguaje serían especialmente formativos y que quería estar en ese proceso. Dejó Eureka Labs en pausa pero con la intención explícita de retomarlo.
Lo que ese movimiento revela, más allá del ruido mediático, es que Karpathy sigue siendo fiel a su pregunta de fondo. En cada etapa de su carrera, en Stanford, en OpenAI, en Tesla, en YouTube, en Eureka, ha estado trabajando en el mismo problema desde ángulos distintos: cómo hacer que la inteligencia, artificial o humana, se vuelva más capaz y más accesible. El cambio a Anthropic es, en ese sentido, completamente coherente con todo lo que ha hecho antes.
En síntesis
Sigo de cerca a Karpathy desde hace años, no solo porque es una de las mentes más agudas de la industria sino porque la pregunta que lo mueve es la misma que me mueve a mí. Él la resuelve construyendo modelos de lenguaje mejores y diseñando cursos que desmitifican la tecnología para cualquiera que quiera aprender. Yo la resuelvo desde otro lugar.
En NEXT llevamos meses trabajando con jóvenes de 13 a 18 años en América Latina, y lo que veo semana a semana es exactamente lo que Karpathy describe cuando habla del tutor ideal: estudiantes que llegan sin saber nada y que en pocas semanas están usando inteligencia artificial para construir cosas reales, para resolver problemas propios, para pensar de maneras que antes no tenían disponibles. La evolución que veo en ellos no es de usuarios que aprendieron a usar una herramienta. Es de personas que empezaron a entender cómo funciona el mundo que les tocó vivir.
Karpathy tiene razón en que la educación es el antídoto contra el desempoderamiento tecnológico tecnológico. Lo que estamos intentando hacer en NEXT es que eso no sea una idea para dentro de diez años sino una realidad para los jóvenes latinoamericanos hoy.
Si querés saber más sobre el programa, podés explorar todo en el botón de abajo.





