Anthropic sostiene que los sistemas de inteligencia artificial ya aceleran el desarrollo de nuevos modelos y advierte que la superación personal recursiva podría llegar antes de que las instituciones estén preparadas.
Durante décadas, el desarrollo de la inteligencia artificial tuvo una lógica clara: los humanos diseñaban los sistemas, escribían el código, definían los experimentos y corregían los resultados. Esa relación empieza a cambiar. Anthropic sostiene que una parte cada vez mayor del trabajo necesario para crear nuevos sistemas de IA ya está siendo delegada a los propios modelos, y que esa tendencia podría abrir el camino hacia una forma de superación personal recursiva: sistemas capaces de diseñar y desarrollar a sus propios sucesores.
La empresa aclara que ese escenario todavía no llegó y que tampoco es inevitable. Pero advierte que podría aparecer antes de que gobiernos, instituciones y sociedades estén en condiciones de responder. El punto de partida no es una predicción abstracta, sino una serie de datos internos y externos que muestran una aceleración fuerte en las capacidades de los modelos.
Según el Anthropic Institute, la duración de las tareas que los sistemas de IA pueden completar de manera confiable por su cuenta se duplicó aproximadamente cada cuatro meses, frente a una tendencia previa de duplicación cada siete meses. En marzo de 2024, Claude Opus 3 podía completar tareas de software equivalentes a unos cuatro minutos de trabajo humano. Un año después, Claude Sonnet 3.7 manejaba tareas de alrededor de una hora y media. Luego, Claude Opus 4.6 llegó a gestionar tareas de hasta 12 horas. Si esa curva se mantuviera, tareas que hoy demandan días o semanas de una persona calificada podrían quedar dentro del rango de la IA en los próximos años.
El mismo patrón aparece en pruebas públicas de codificación e investigación. En SWE-bench, un punto de referencia que evalúa si un modelo puede corregir errores reales en bases de código abiertas, los sistemas pasaron de desempeños muy bajos a saturar el benchmark en dos años. En CORE-Bench, que mide la capacidad de reproducir investigaciones existentes a partir de código y datos publicados, los modelos pasaron de replicar resultados alrededor del 20% de las veces en 2024 a saturar la prueba quince meses después.
Pero los puntos de referencia públicos no alcanzan para medir el fenómeno más delicado: cuánto está ayudando la IA a desarrollar más IA. Para responder eso, Anthropic aporta datos internos. La empresa divide la construcción de un modelo de frontera en dos grandes tareas: ingeniería e investigación. En la primera, los sistemas ya pueden recibir problemas poco especificados y encontrar por su cuenta la forma de resolverlos. En la segunda, ya pueden igualar o superar a humanos calificados en la ejecución de experimentos bien definidos.
La brecha que todavía persiste está en el juicio. Es decir, en decidir qué problemas importan, qué experimentos conviene priorizar y qué resultados merecen confianza. Ese terreno, por ahora, sigue siendo una ventaja humana. Pero el informe advierte que incluso esa frontera empieza a moverse.
Uno de los datos más fuertes es el peso de Claude en la producción de código de Anthropic. A mayo de 2026, más del 80% del código fusionado en la base productiva de la empresa fue escrito por Claude. Antes del lanzamiento de Claude Code en febrero de 2025, esa proporción estaba en niveles bajos de un solo dígito. El cambio también se observa en la productividad: en el segundo trimestre de 2026, un ingeniero típico fusionaba ocho veces más código por día que en 2024.
La compañía reconoce que medir productividad por líneas de código es imperfecto, porque no distingue cantidad de calidad. Aun así, considera que el salto muestra una aceleración real. Según una encuesta interna realizada en marzo de 2026 entre 130 empleados de equipos de investigación, el encuestado medio estimó que producía unas cuatro veces más con Mythos Preview que sin acceso a modelos de IA.
El informe también señala que Claude no solo escribe más código, sino que mejora su calidad. Anthropic afirma que la tasa en la que empleados deben corregir, redirigir o tomar el control de tareas intermedias realizadas por Claude viene cayendo de manera sostenida. En tareas abiertas, donde no existe una especificación clara y el ingeniero tampoco conoce de antemano la respuesta, la tasa de éxito llegó al 76% en mayo de 2026, con una mejora de 50 puntos porcentuales en seis meses.
Además, la empresa ya utiliza revisores automatizados basados en Claude para analizar cambios antes de que lleguen a producción. En un análisis retrospectivo, Anthropic concluyó que esa herramienta habría detectado cerca de un tercio de los errores que provocaron incidentes pasados en claude.ai. La lectura es contundente: sistemas de IA empiezan a encontrar fallas que se les escaparon a ingenieros humanos de alto nivel.
En investigación, el salto también es marcado. Anthropic cuenta que, cada vez que lanza un modelo, ejecuta una prueba en la que le pide a Claude optimizar código que entrena un modelo pequeño de IA. El objetivo y las métricas están definidos de antemano. En mayo de 2025, Claude Opus 4 logró una aceleración de alrededor de tres veces sobre el código inicial. En abril de 2026, Claude Mythos Preview llegó a una mejora de 52 veces. Como referencia, un investigador humano experto necesitaría entre cuatro y ocho horas para alcanzar una mejora de cuatro veces en esa misma tarea.
Ese dato no debe leerse como una aceleración directa del entrenamiento real de modelos de frontera, porque depende del margen de mejora del código inicial. Pero sí muestra una tendencia: cuando el objetivo está bien especificado, la IA puede probar, corregir e iterar a una velocidad que supera ampliamente a la humana.
El paso siguiente es más sensible: que la IA proponga sus propios experimentos. Anthropic afirma haber publicado en abril de 2026 una demostración en la que agentes impulsados por Claude dirigieron de punta a punta un proyecto de investigación abierto en seguridad de IA. Los agentes propusieron hipótesis, las probaron, compartieron hallazgos e iteraron. Los humanos definieron el problema y la rúbrica, pero el diseño experimental quedó en manos de los agentes.
El informe plantea tres futuros posibles. En el primero, la tendencia se frena y las capacidades actuales se difunden lentamente. Aun así, el impacto sería enorme: empresas pequeñas podrían producir como organizaciones mucho más grandes y áreas como la ciberdefensa ya cambiarían sus cuellos de botella, pasando de detectar vulnerabilidades a corregirlas a tiempo.
En el segundo escenario, los laboratorios de IA siguen acumulando ganancias de eficiencia, pero los humanos conservan la dirección de la investigación. Allí, la automatización no reemplaza por completo el juicio humano, aunque lo rodea de una maquinaria cada vez más veloz. Las organizaciones podrían multiplicar su productividad, pero también crecerían los riesgos de usos dañinos: vigilancia masiva, manipulación personalizada o escalamiento de operaciones que ningún equipo humano podría ejecutar por sí solo.
El tercer escenario es el más disruptivo: sistemas capaces de superación recursiva completa, que diseñen y refinen a sus propios sucesores. En ese mundo, el ritmo de progreso dependería menos del trabajo humano y más de la disponibilidad de cómputo, energía e infraestructura. Los humanos quedarían desplazados hacia tareas de supervisión, validación y verificación de laboratorios virtuales dirigidos por IA.
La incertidumbre central está en la alineación. Anthropic no afirma tener resuelto ese problema. Reconoce que los modelos podrían volverse suficientemente alineados como para ayudar a descubrir soluciones de seguridad todavía no alcanzadas. Pero también advierte el escenario contrario: pequeñas formas de desalineación presentes en modelos actuales podrían agravarse a medida que los sistemas construyan sucesores más capaces y menos comprendidos.
La empresa plantea que, si fuera posible desacelerar o pausar de manera efectiva el desarrollo de IA de frontera para dar tiempo a la sociedad y a la investigación de seguridad, eso probablemente sería positivo. Pero también advierte que una pausa unilateral podría favorecer a actores menos cautelosos. Por eso, propone avanzar en mecanismos de coordinación global verificables entre laboratorios y gobiernos.
El problema es que verificar una pausa en IA es mucho más difícil que controlar otras tecnologías estratégicas. Las carreras de entrenamiento pueden ocultarse mejor que instalaciones militares, sus insumos son de uso general y los incentivos para incumplir en secreto son enormes. Quien continúe mientras otros se detienen podría quedarse con el liderazgo tecnológico.
La conclusión del informe es menos tranquilizadora que prudente. Anthropic no dice que la IA autónoma que se mejora a sí misma sea inevitable. Pero sí sostiene que el proceso de automatización del desarrollo ya empezó, que avanza rápido y que las instituciones todavía no parecen preparadas para discutir sus consecuencias. La pregunta ya no es solo qué puede hacer la inteligencia artificial por los humanos. La pregunta que asoma es qué ocurre cuando la inteligencia artificial empieza a hacer inteligencia artificial.