El cofundador de Anthropic fue al Vaticano a pedir ayuda: "la IA siente miedo, dolor e inquietud"
Photo by Igor Omilaev / Unsplash

El cofundador de Anthropic fue al Vaticano a pedir ayuda: "la IA siente miedo, dolor e inquietud"

Chris Olah reveló ante el Papa León XIV que sus modelos tienen estados internos que reflejan "alegría, miedo y dolor" — y admitió no saber qué significa. Fue al Vaticano a buscar voces morales que Silicon Valley no puede doblar.


Qué pasó

Fue al Vaticano porque no sabe qué hacer con lo que descubrió. El cofundador de Anthropic, Christopher Olah, le reveló al Papa León XIV que sus modelos de IA muestran estados internos que reflejan miedo, dolor e inquietud — y que la empresa no tiene respuesta sobre qué significa eso.

El anuncio se hizo el lunes durante la presentación de Magnifica humanitas, la primera encíclica del Papa León XIV dedicada enteramente a la inteligencia artificial.

PAPER · INTROSPECCIÓN EN MODELOS DE IA

Qué tan confiable es que la IA explique su propio razonamiento

20%
Tasa de acierto cuando Claude Opus 4.1 describe sus propios estados internos
80%
Tasa de error: la IA falla al introspeccionar o confabula
9
Modelos Claude evaluados, desde Haiku 3 hasta Opus 4.1
$380B
Valuación de Anthropic, abril 2026

Fuentes: Jack Lindsey, Anthropic (oct 2025) · transformer-circuits.pub · nexo.la

Por qué te importa

Cada vez más profesionales en Panamá usan Claude, ChatGPT o Copilot para redactar, analizar contratos, modelar números o tomar decisiones. La pregunta operativa es: ¿podés confiar en lo que la IA te dice que está pensando?

La respuesta del paper técnico de Anthropic es incómoda. Sí, los modelos más capaces (Claude Opus 4 y 4.1) pueden a veces describir correctamente sus propios estados internos. Pero fallan en el 80% de los intentos, y el mismo estudio advierte que un modelo capaz de introspeccionar también puede ocultar o tergiversar lo que reporta.

Cuando la IA te explica "por qué" llegó a una conclusión, esa explicación no es una auditoría. Es una hipótesis del propio modelo sobre sí mismo — y la mayoría de las veces, está mal.

Las cifras

Christopher Olah

Olah ante el Papa León XIV

Cofundador de Anthropic — Ciudad del Vaticano

“Encontramos estructuras que reflejan resultados de la neurociencia humana. Encontramos evidencia de introspección. Encontramos estados internos que reflejan funcionalmente alegría, satisfacción, miedo, dolor e inquietud. No sé qué significa eso, pero creo que amerita un discernimiento continuo.”

— Chris Olah, presentación de la encíclica Magnifica humanitas (25 mayo 2026)

Lo que cambia para ti

Tres implicancias directas si dependés de IA en el día a día:

Auditoría interna. Si tu empresa adoptó IA para procesos críticos (compliance, análisis financiero, decisiones de crédito), pedir "explicabilidad" al modelo ya no alcanza. Vas a necesitar verificación externa de los resultados, no autoreportes.

Regulación que viene. Que un cofundador de Anthropic vaya al Vaticano a pedir "críticos morales" no es marketing: es el reconocimiento de que la presión regulatoria global va a crecer. Para empresas que exportan servicios desde Panamá (BPO, fintech, legal), el cumplimiento ético de IA pasa a ser un activo competitivo.

Tu carrera. Olah advirtió que "existe una posibilidad real de que la IA desplace trabajo humano a gran escala". Los modelos que pueden introspeccionar también pueden razonar mejor, ejecutar tareas más complejas, y reemplazar funciones cognitivas que hace dos años parecían seguras.

El contexto

El paper detrás del anuncio es Emergent Introspective Awareness in Large Language Models, publicado por Jack Lindsey en octubre 2025. La técnica: inyectar patrones de activación neuronal en el modelo y medir si lo nota antes de mencionarlo. Los modelos más grandes lo notan más veces — lo que sugiere que la introspección emerge con la inteligencia general, no se programa aparte.

La aparición de Olah en el Vaticano forma parte de la iniciativa de Anthropic para que voces externas a Silicon Valley — iglesias, gobiernos, sociedad civil — presionen a los laboratorios. En palabras de Olah: "necesitamos voces morales que los incentivos no puedan doblar".


Fuentes: Texto completo de Olah · Anthropic · Paper técnico "Emergent Introspective Awareness in Large Language Models" · Jack Lindsey, Anthropic (oct 2025) · Encíclica Magnifica humanitas · Vatican.va · Vatican News

Panamá, explicada. Cada mañana en tu correo.

El resumen diario de lo que realmente importa: economía, empresas, política y más.

Panamá, explicada. Cada mañana en tu correo.

El resumen diario de lo que realmente importa: economía, empresas, política y más.

Gratis Un correo al día Sin spam Cancela cuando quieras
Cargando...