Apple Foundation Models: qué pueden hacer los desarrolladores Mac independientes con IA en el dispositivo

Durante unos tres años, cualquier desarrollador independiente que quisiera incluir «funciones de IA» tuvo que tomar la misma incómoda decisión. O pagar una factura a OpenAI o Anthropic que escalaba linealmente con los usuarios, o prescindir de las funciones de IA por completo. La matemática para una app de pago único era brutal. Unos pocos céntimos por usuario al mes destruyen el margen de una app de $9,99 de por vida en cuestión de meses.

El framework Foundation Models de Apple, anunciado en la WWDC 2025 y disponible en macOS 26 (Tahoe), cambia la matemática. El framework ofrece a los desarrolladores acceso programático al mismo modelo de lenguaje en el dispositivo que impulsa las funciones de Apple Intelligence en el Mac del usuario. El modelo funciona de forma local. Tu app no paga por inferencia. El usuario no necesita ninguna clave de API. El texto nunca sale del dispositivo.

Esta entrada es un recorrido práctico por lo que los desarrolladores independientes pueden hacer realmente con el framework, en qué no es bueno, y qué significa el cambio arquitectónico para una app Mac enfocada.

Qué obtienes

El framework expone una LanguageModelSession que puedes enviar con texto. El modelo responde con texto, y opcionalmente con un objeto estructurado que especificas con el macro @Generable. El modo de salida estructurada es el más útil para la mayoría de las apps porque te permite decir «devuélveme JSON conforme a este esquema» en vez de intentar parsear texto libre.

Un flujo típico se ve así:

Crea una sesión con instrucciones de sistema que describan la tarea del modelo.
Envía un mensaje de usuario.
Lee la respuesta estructurada.
Usa la respuesta para impulsar tu app.

Todo esto funciona en milisegundos para prompts cortos y unos pocos segundos para los largos. No hay llamada de red. No hay clave de API. No hay límite de peticiones más allá de lo que el propio dispositivo pueda sostener.

El mismo prompt procesado por un LLM en la nube (arriba) o por el framework Foundation Models en el dispositivo de Apple (abajo). El camino en el dispositivo no tiene salto de red ni cobro por llamada.

En qué es realmente bueno el modelo

El modelo en el dispositivo es pequeño comparado con un modelo de la nube de última generación. No es GPT-4. Tratarlo como tal lleva a la decepción. Donde brilla es en una clase específica de tareas:

Clasificación. «¿Es esta cadena una frase de fecha o no?» «¿A cuál de estas cinco categorías pertenece esta tarea?» Estas son tareas que el modelo en el dispositivo maneja con fiabilidad y rapidez.
Extracción estructurada. Sacar campos específicos de una entrada de texto libre. «¿Qué hora del día referencia esta frase?» «¿Cuál es el verbo en esta frase?» El modo de salida estructurada del framework está diseñado para esto.
Reescritura corta de texto. Convertir una nota informal en un título limpio, resumir un párrafo en una sola frase, corregir la gramática de un borrador. El modelo es bueno en transformaciones de texto pequeñas y contenidas.
Cambios de tono. Hacer un borrador más cálido, más conciso o más profesional. Con la misma restricción: entradas cortas, salidas contenidas.

Esto es la mayor parte de lo que una app de productividad necesita realmente. Fíjate en lo que no aparece en la lista: generación de texto largo, razonamiento complejo, preguntas de conocimiento del mundo, generación de código. El modelo en el dispositivo puede hacer esas cosas, pero no tan bien como un modelo de la nube. Si son esenciales para tu producto, sigues necesitando la nube.

En qué no es bueno el modelo

Tres clases de tarea donde conviene buscar otra cosa:

Contexto largo. El modelo en el dispositivo tiene una ventana de contexto más pequeña que un modelo de la nube. Pasarle un documento de 50 páginas y pedir un análisis no va a salir bien. Dale el extracto relevante en su lugar.
Escritura creativa abierta. Puede hacer escritura creativa corta, pero notarás la diferencia con respecto a un modelo de la nube de vanguardia. Si tu app es un asistente de escritura para novelistas, este probablemente no es tu modelo.
Tareas donde el usuario espera calidad de última generación. Si tus usuarios van a comparar tu salida con ChatGPT y juzgar en consecuencia, vas a perder. El modelo es excelente para utilidad invisible, menos para tareas donde la IA es el producto visible.

El enfoque correcto es: usa el modelo en el dispositivo para hacer la app más inteligente en segundo plano, no para ser el producto visible.

Qué significa esto para los precios independientes

La consecuencia más interesante del modelo en el dispositivo es su implicación en los precios. Durante la mayor parte de los últimos tres años, el consejo estándar para desarrolladores independientes que querían incluir funciones de IA era «tienes que cobrar una suscripción, porque los costes de inferencia son reales y recurrentes». Ese consejo era correcto.

Ya no lo es para apps donde la inteligencia en el dispositivo es suficiente. La razón principal por la que una app de pago único no podía incluir IA era el coste recurrente. Si ese coste es cero, el modelo se rompe. Puedes incluir funciones de IA en una app de pago único y no quebrar.

Esto es importante para la pequeña ola de apps independientes para Mac que está intentando revivir el modelo de pago único. Escribimos sobre la tendencia más amplia pero la pieza de IA es una de las razones técnicas reales por las que funciona en 2026.

Cómo empezar

El framework es parte del SDK estándar de Apple en macOS 26. No hay descarga separada. No hay clave de API. No hay cuenta que crear. Añade import FoundationModels a un archivo Swift, crea una LanguageModelSession, envía un prompt, lee la respuesta.

El modelo está disponible en Macs con Apple Silicon que cumplen los requisitos del sistema para Apple Intelligence. Los Macs Intel más antiguos no tienen acceso al framework, así que tu app necesita una estrategia de respaldo si quieres que sean compatibles. Para la mayoría de las apps independientes para Mac que se publican hoy, una comprobación de disponibilidad y una ruta de degradación elegante son suficientes. El usuario sin el modelo obtiene la versión basada en expresiones regulares de la función; el usuario con el modelo obtiene la versión más inteligente.

Cómo se ve esto en TodoBar

TodoBar usa el framework como respaldo para el procesamiento de fechas en lenguaje natural. El camino rápido son las expresiones regulares, que capturan alrededor del 90 % de las frases de fecha en menos de un milisegundo. Cuando el camino de expresiones regulares falla, el modelo en el dispositivo lo intenta, con una latencia típica de unos 50 milisegundos, y devuelve una clasificación estructurada de lo que el usuario quiso decir. Describimos el pipeline completo en la entrada sobre procesamiento de fechas.

El modelo es invisible para el usuario. No saben que está ahí. Solo notan que «en un par de horas» funciona igual que «en 2 horas». Eso es lo que se siente como buena IA en el dispositivo.

Y es también por qué una app de pago único de $9,99 puede incluir una función que habría requerido una suscripción hace un año. La matemática por fin funciona.