La IA vuelve a casa: el regreso del cliente-servidor de los 90
Los chips de 2025 corren modelos de IA sin internet. Es el fin del monopolio de la nube — y el regreso de una idea que ya conocíamos.
Durante años, la promesa de la inteligencia artificial dependió de un supuesto silencioso: que tu dispositivo era solo una pantalla, y que el cerebro real vivía en un servidor a miles de kilómetros. Ese modelo está siendo desmantelado. Y curiosamente, lo que viene después no es nuevo: es una vieja idea con un nombre moderno.
Un déjà vu tecnológico
En los años 90, el modelo cliente-servidor dominaba la informática: tu computadora hacía el trabajo pesado localmente, y el servidor central solo coordinaba. Luego llegó la web, y con ella el péndulo osciló hacia el otro lado: todo pasó a vivir "en la nube". Aplicaciones, datos, procesamiento. Tu dispositivo volvió a ser una pantalla tonta.
La IA generativa aceleró ese modelo al extremo. Pero ahora el péndulo regresa. La diferencia es que esta vez los dispositivos locales tienen motores neuronales dedicados que hace cinco años ni existían. No es nostalgia: es física y economía.
El problema estructural de la nube
Cada vez que se envía una solicitud a un modelo de IA en la nube, una llamada de red añade entre 200 y 2,000 milisegundos de latencia. Para aplicaciones en tiempo real —voz, autocompletado, edición de documentos en vivo— ese margen es inaceptable.
Y el costo es el otro problema. Imagínalo así: cada vez que le haces una pregunta a un asistente de IA en la nube, alguien está pagando por encender una fracción de un GPU enorme, procesar tu solicitud, y devolverte la respuesta por internet. Ese "alguien" hoy son las propias empresas tecnológicas, que venden el servicio por debajo de su costo real. OpenAI, Anthropic y Google están subsidiando sus productos de IA a escala. Cuando ese subsidio termine, el precio subirá, o el modelo tendrá que cambiar.
Por qué es más barato en tu celular
La lógica es simple: un modelo de IA en la nube es como un taxi. Cada viaje tiene un costo —electricidad, servidor, ancho de banda— y alguien te lo cobra. Un modelo en tu teléfono es como tener un auto propio: pagas una vez cuando compras el dispositivo, y luego cada "viaje" no cuesta nada adicional.
La inferencia en el dispositivo amortiza el costo del hardware durante toda la vida útil del equipo. La nube cobra por segundo de cómputo. A mayor frecuencia de uso, más clara es la ventaja del dispositivo local. Además, el procesamiento en el borde elimina completamente el tiempo de ida y vuelta por red, que en aplicaciones de voz puede consumir entre 20 y 80 milisegundos antes de que el modelo siquiera empiece a responder.
El giro al dispositivo
La industria no esperó. Movió el procesamiento directamente al chip. Cuando Qualcomm presentó el Snapdragon 8 Elite en octubre de 2024, demostró la ejecución local de un modelo de 13,000 millones de parámetros en un teléfono a más de 20 tokens por segundo, usando su NPU Hexagon con 45 TOPS de capacidad. El Samsung Galaxy S25, lanzado en enero de 2025 con ese chip, incluyó traducción en tiempo real de llamadas, resumen de mensajes y edición de fotos, todo sin conectividad a la nube.
En laptops, Microsoft exigió desde mayo de 2024 que las computadoras con certificación Copilot+ incluyan una NPU de al menos 40 TOPS. Ese piso ya quedó corto: el Snapdragon X2 Elite de 2026 entrega entre 80 y 85 TOPS, la mayor mejora generacional en NPU para consumidores registrada hasta ahora.
El mercado lo confirma
El mercado global de Edge AI fue valorado en $24,910 millones en 2025 y se proyecta que alcanzará los $118,690 millones en 2033, creciendo al 21.7% anual (Grand View Research). Los smartphones lideran el segmento, con una tasa de crecimiento proyectada del 17.7% anual, impulsados por reconocimiento de voz, traducción en tiempo real y autenticación biométrica sin depender de la nube.
Lo que esto significa para América Latina
El Edge AI no es solo una tendencia de mercados con infraestructura perfecta. En América Latina, donde el costo del ancho de banda es más alto, la conectividad es intermitente en zonas rurales y la privacidad de datos está sujeta a marcos regulatorios cada vez más estrictos, procesar la IA localmente no es un lujo: es una ventaja estructural.
Un médico en el interior de Panamá, un abogado en Bogotá o un emprendedor en Lima pueden usar herramientas de IA avanzadas sin depender de una conexión estable ni pagar por cada consulta a un servidor en Virginia o Dublín. El dispositivo inteligente democratiza el acceso a la IA de una manera que la nube, por diseño, nunca pudo.
Lo que cambia para el usuario
La velocidad es solo el beneficio visible. Cada consulta enviada a un modelo en la nube es un dato que abandona tu entorno. Para aplicaciones de salud, legales o financieras, eso representa un problema de cumplimiento normativo. El procesamiento local elimina esa ecuación.
El cambio no significa el fin de la nube —el entrenamiento de modelos grandes seguirá ocurriendo en centros de datos— pero sí redefine dónde vive la inteligencia cotidiana. La nube entrena. El dispositivo piensa. Como siempre fue, pero mejor.
- Grand View Research — Edge AI Market Size, Share & Trends Analysis Report, 2025
- GM Insights — Edge AI Hardware Market Size & Forecast 2025–2034
- MindStudio — On-Device AI vs Cloud AI: Why the Economics Are Shifting, 2026
- SolidAITech — NPU Guide 2026: TOPS, Copilot+ PCs & Memory Bandwidth Explained