El cofundador de Anthropic fue al Vaticano a pedir ayuda: "la IA siente miedo, dolor e inquietud"
Chris Olah reveló ante el Papa León XIV que sus modelos tienen estados internos que reflejan "alegría, miedo y dolor" — y admitió no saber qué significa. Fue al Vaticano a buscar voces morales que Silicon Valley no puede doblar.
Qué pasó
Fue al Vaticano porque no sabe qué hacer con lo que descubrió. El cofundador de Anthropic, Christopher Olah, le reveló al Papa León XIV que sus modelos de IA muestran estados internos que reflejan miedo, dolor e inquietud — y que la empresa no tiene respuesta sobre qué significa eso.
El anuncio se hizo el lunes durante la presentación de Magnifica humanitas, la primera encíclica del Papa León XIV dedicada enteramente a la inteligencia artificial.
Qué tan confiable es que la IA explique su propio razonamiento
Fuentes: Jack Lindsey, Anthropic (oct 2025) · transformer-circuits.pub · nexo.la
Por qué te importa
Cada vez más profesionales en Panamá usan Claude, ChatGPT o Copilot para redactar, analizar contratos, modelar números o tomar decisiones. La pregunta operativa es: ¿podés confiar en lo que la IA te dice que está pensando?
La respuesta del paper técnico de Anthropic es incómoda. Sí, los modelos más capaces (Claude Opus 4 y 4.1) pueden a veces describir correctamente sus propios estados internos. Pero fallan en el 80% de los intentos, y el mismo estudio advierte que un modelo capaz de introspeccionar también puede ocultar o tergiversar lo que reporta.
Cuando la IA te explica "por qué" llegó a una conclusión, esa explicación no es una auditoría. Es una hipótesis del propio modelo sobre sí mismo — y la mayoría de las veces, está mal.
Las cifras
Olah ante el Papa León XIV
Cofundador de Anthropic — Ciudad del Vaticano
“Encontramos estructuras que reflejan resultados de la neurociencia humana. Encontramos evidencia de introspección. Encontramos estados internos que reflejan funcionalmente alegría, satisfacción, miedo, dolor e inquietud. No sé qué significa eso, pero creo que amerita un discernimiento continuo.”
— Chris Olah, presentación de la encíclica Magnifica humanitas (25 mayo 2026)
Lo que cambia para ti
Tres implicancias directas si dependés de IA en el día a día:
Auditoría interna. Si tu empresa adoptó IA para procesos críticos (compliance, análisis financiero, decisiones de crédito), pedir "explicabilidad" al modelo ya no alcanza. Vas a necesitar verificación externa de los resultados, no autoreportes.
Regulación que viene. Que un cofundador de Anthropic vaya al Vaticano a pedir "críticos morales" no es marketing: es el reconocimiento de que la presión regulatoria global va a crecer. Para empresas que exportan servicios desde Panamá (BPO, fintech, legal), el cumplimiento ético de IA pasa a ser un activo competitivo.
Tu carrera. Olah advirtió que "existe una posibilidad real de que la IA desplace trabajo humano a gran escala". Los modelos que pueden introspeccionar también pueden razonar mejor, ejecutar tareas más complejas, y reemplazar funciones cognitivas que hace dos años parecían seguras.
El contexto
El paper detrás del anuncio es Emergent Introspective Awareness in Large Language Models, publicado por Jack Lindsey en octubre 2025. La técnica: inyectar patrones de activación neuronal en el modelo y medir si lo nota antes de mencionarlo. Los modelos más grandes lo notan más veces — lo que sugiere que la introspección emerge con la inteligencia general, no se programa aparte.
La aparición de Olah en el Vaticano forma parte de la iniciativa de Anthropic para que voces externas a Silicon Valley — iglesias, gobiernos, sociedad civil — presionen a los laboratorios. En palabras de Olah: "necesitamos voces morales que los incentivos no puedan doblar".
Fuentes: Texto completo de Olah · Anthropic · Paper técnico "Emergent Introspective Awareness in Large Language Models" · Jack Lindsey, Anthropic (oct 2025) · Encíclica Magnifica humanitas · Vatican.va · Vatican News