Tecnología

La IA vuelve a casa: el regreso del cliente-servidor de los 90

Los chips de 2025 corren modelos de IA sin internet. Es el fin del monopolio de la nube — y el regreso de una idea que ya conocíamos.

24 de junio de 2026, 09:06 — 4 min de lectura

Durante años, la promesa de la inteligencia artificial dependió de un supuesto silencioso: que tu dispositivo era solo una pantalla, y que el cerebro real vivía en un servidor a miles de kilómetros. Ese modelo está siendo desmantelado. Y curiosamente, lo que viene después no es nuevo: es una vieja idea con un nombre moderno.

Un déjà vu tecnológico

En los años 90, el modelo cliente-servidor dominaba la informática: tu computadora hacía el trabajo pesado localmente, y el servidor central solo coordinaba. Luego llegó la web, y con ella el péndulo osciló hacia el otro lado: todo pasó a vivir "en la nube". Aplicaciones, datos, procesamiento. Tu dispositivo volvió a ser una pantalla tonta.

La IA generativa aceleró ese modelo al extremo. Pero ahora el péndulo regresa. La diferencia es que esta vez los dispositivos locales tienen motores neuronales dedicados que hace cinco años ni existían. No es nostalgia: es física y economía.

El problema estructural de la nube

Cada vez que se envía una solicitud a un modelo de IA en la nube, una llamada de red añade entre 200 y 2,000 milisegundos de latencia. Para aplicaciones en tiempo real —voz, autocompletado, edición de documentos en vivo— ese margen es inaceptable.

Y el costo es el otro problema. Imagínalo así: cada vez que le haces una pregunta a un asistente de IA en la nube, alguien está pagando por encender una fracción de un GPU enorme, procesar tu solicitud, y devolverte la respuesta por internet. Ese "alguien" hoy son las propias empresas tecnológicas, que venden el servicio por debajo de su costo real. OpenAI, Anthropic y Google están subsidiando sus productos de IA a escala. Cuando ese subsidio termine, el precio subirá, o el modelo tendrá que cambiar.

Por qué es más barato en tu celular

La lógica es simple: un modelo de IA en la nube es como un taxi. Cada viaje tiene un costo —electricidad, servidor, ancho de banda— y alguien te lo cobra. Un modelo en tu teléfono es como tener un auto propio: pagas una vez cuando compras el dispositivo, y luego cada "viaje" no cuesta nada adicional.

La inferencia en el dispositivo amortiza el costo del hardware durante toda la vida útil del equipo. La nube cobra por segundo de cómputo. A mayor frecuencia de uso, más clara es la ventaja del dispositivo local. Además, el procesamiento en el borde elimina completamente el tiempo de ida y vuelta por red, que en aplicaciones de voz puede consumir entre 20 y 80 milisegundos antes de que el modelo siquiera empiece a responder.

El giro al dispositivo

La industria no esperó. Movió el procesamiento directamente al chip. Cuando Qualcomm presentó el Snapdragon 8 Elite en octubre de 2024, demostró la ejecución local de un modelo de 13,000 millones de parámetros en un teléfono a más de 20 tokens por segundo, usando su NPU Hexagon con 45 TOPS de capacidad. El Samsung Galaxy S25, lanzado en enero de 2025 con ese chip, incluyó traducción en tiempo real de llamadas, resumen de mensajes y edición de fotos, todo sin conectividad a la nube.

En laptops, Microsoft exigió desde mayo de 2024 que las computadoras con certificación Copilot+ incluyan una NPU de al menos 40 TOPS. Ese piso ya quedó corto: el Snapdragon X2 Elite de 2026 entrega entre 80 y 85 TOPS, la mayor mejora generacional en NPU para consumidores registrada hasta ahora.

200–2,000 ms

Latencia añadida por cada llamada a un modelo de IA en la nube

85 TOPS

Potencia de la NPU del Snapdragon X2 Elite (2026), el doble que hace un año

$119B

Tamaño proyectado del mercado Edge AI para 2033

Costo adicional por inferencia cuando el modelo corre en tu dispositivo

El mercado lo confirma

El mercado global de Edge AI fue valorado en $24,910 millones en 2025 y se proyecta que alcanzará los $118,690 millones en 2033, creciendo al 21.7% anual (Grand View Research). Los smartphones lideran el segmento, con una tasa de crecimiento proyectada del 17.7% anual, impulsados por reconocimiento de voz, traducción en tiempo real y autenticación biométrica sin depender de la nube.

Lo que esto significa para América Latina

El Edge AI no es solo una tendencia de mercados con infraestructura perfecta. En América Latina, donde el costo del ancho de banda es más alto, la conectividad es intermitente en zonas rurales y la privacidad de datos está sujeta a marcos regulatorios cada vez más estrictos, procesar la IA localmente no es un lujo: es una ventaja estructural.

Un médico en el interior de Panamá, un abogado en Bogotá o un emprendedor en Lima pueden usar herramientas de IA avanzadas sin depender de una conexión estable ni pagar por cada consulta a un servidor en Virginia o Dublín. El dispositivo inteligente democratiza el acceso a la IA de una manera que la nube, por diseño, nunca pudo.

Lo que cambia para el usuario

La velocidad es solo el beneficio visible. Cada consulta enviada a un modelo en la nube es un dato que abandona tu entorno. Para aplicaciones de salud, legales o financieras, eso representa un problema de cumplimiento normativo. El procesamiento local elimina esa ecuación.

El cambio no significa el fin de la nube —el entrenamiento de modelos grandes seguirá ocurriendo en centros de datos— pero sí redefine dónde vive la inteligencia cotidiana. La nube entrena. El dispositivo piensa. Como siempre fue, pero mejor.

Referencias

Grand View Research — Edge AI Market Size, Share & Trends Analysis Report, 2025
GM Insights — Edge AI Hardware Market Size & Forecast 2025–2034
MindStudio — On-Device AI vs Cloud AI: Why the Economics Are Shifting, 2026
SolidAITech — NPU Guide 2026: TOPS, Copilot+ PCs & Memory Bandwidth Explained

La IA vuelve a casa: el regreso del cliente-servidor de los 90

Un déjà vu tecnológico

El problema estructural de la nube

Por qué es más barato en tu celular

El giro al dispositivo

El mercado lo confirma

Lo que esto significa para América Latina

Lo que cambia para el usuario

Lo más importante de Panamá, cada mañana.

Panamá, explicada. Cada mañana en tu correo.

Las más leídas

Panamá, explicada. Cada mañana en tu correo.

Un déjà vu tecnológico

El problema estructural de la nube

Por qué es más barato en tu celular

El giro al dispositivo

El mercado lo confirma

Lo que esto significa para América Latina

Lo que cambia para el usuario

Lo más importante de Panamá, cada mañana.

Panamá, explicada. Cada mañana en tu correo.

Las más leídas

Artículos relacionados

11:37 am — El streaming se quedó con el deporte: $14,200 millones y el colapso definitivo del cable

11:30 pm — ChatGPT ahora puede ver tu cuenta bancaria: lo que debes saber

9:29 am — Ucrania lanza TrophyLab para compartir tecnología militar rusa capturada con socios verificados

11:30 pm — 10,000 becas para aprender IA en Panamá: cómo acceder

Panamá, explicada. Cada mañana en tu correo.