GPT Diffusion

WWDC 2026: lo que realmente anunció Apple y qué cambia para devs

2026-06-11 · Devs #apple#gemini#on-device#agentes#sdk#herramientas

TL;DR

  • Apple lanz\u00f3 iOS 27, macOS 27 “Golden Gate” y toda la familia 27 (watchOS, visionOS, tvOS). Fue el \u00faltimo keynote de Tim Cook como CEO; John Ternus asume el 1 de septiembre.
  • Siri se reconstruy\u00f3 sobre un modelo Gemini de ~1.2T par\u00e1metros (MoE) con ruta a Google Cloud (Nvidia B200). Acuerdo estimado en $1B/a\u00f1o. Tres capas: on-device, Private Cloud Compute y Gemini en la nube.
  • El Foundation Models Framework introduce el protocolo LanguageModel, que permite swap de proveedores (Apple on-device, Gemini, Claude) cambiando una dependencia de SPM. Sin tocar la l\u00f3gica de sesi\u00f3n.
  • Core AI es el nuevo framework para desplegar modelos LLM custom on-device, sucesor conceptual de Core ML para lenguaje.
  • SiriKit queda deprecado. App Intents es la \u00fanica v\u00eda de integraci\u00f3n con el nuevo Siri. Ventana de migraci\u00f3n: 2-3 a\u00f1os.
  • Xcode 27 trae coding agentic dual (modelo local + agentes externos via Claude/Gemini/OpenAI), integraci\u00f3n de MCP con 20+ tools y Device Hub para interactuar con el simulador.
  • Siri AI no llega a la UE ni China en iOS 27/iPadOS 27 por el DMA. S\u00ed en macOS y visionOS.
  • Para devs del App Store Small Business Program (<2M downloads): uso de Foundation Models en Private Cloud Compute sin coste de API.

Lo que pas\u00f3 vs. lo que se rumoreaba

En el preview que publicamos antes del keynote, la mayor\u00eda de las predicciones se confirmaron con matices. Lo acertado: Siri con Gemini, Foundation Models ampliado, macOS solo para Apple Silicon, Xcode Intelligence. Lo que no se esperaba: la deprecaci\u00f3n formal de SiriKit con una fecha concreta, el protocolo LanguageModel como capa de abstracci\u00f3n, y Core AI como framework independiente.

Lo que no pas\u00f3: el HomePad, homeOS como plataforma unificada, y un modelo de suscripci\u00f3n tipo “Apple Intelligence Pro”. Al menos por ahora.

Siri AI: la arquitectura de tres capas

El nuevo Siri no es una actualizaci\u00f3n incremental. Apple reconstruy\u00f3 toda la pila de inteligencia con una arquitectura de routing en tres niveles:

CapaD\u00f3nde ejecutaPara qu\u00e9
On-deviceApple Neural Engine en A18/M4+Queries simples, r\u00e1pidas, privadas. Zero latencia de red.
Private Cloud ComputeApple Silicon en servidores de AppleTareas moderadamente complejas. Sin persistencia de datos.
Google CloudNvidia Blackwell B200, modelo Gemini ~1.2T (MoE)Razonamiento pesado, conversaciones multi-turno, an\u00e1lisis multimodal.

El modelo de Gemini que corre en Google Cloud es un custom MoE de ~1.2 billones de par\u00e1metros dise\u00f1ado espec\u00edficamente para Apple. Apple act\u00faa como proxy: las queries se anonimizan, se eliminan los enlaces a Apple ID, y se tokenizan antes de llegar a infra de terceros. Apple firm\u00f3 contractualmente que Google no puede usar esas queries para entrenar modelos.

La ventana de contexto del modelo servidor es de 32K tokens con niveles de razonamiento configurables.

Lo pr\u00e1ctico: si tu app necesita inferencia local para algo r\u00e1pido y sensible, la capa on-device te cubre. Si necesitas razonamiento complejo, la ruta a Gemini lo maneja. No tienes que decidir d\u00f3nde corre cada query — el sistema lo hace por ti.

La trampa: la capa m\u00e1s potente requiere iPhone 17 Pro o iPhone Air. Dispositivos anteriores se quedan en las dos primeras capas. Y en la UE, la capa de Gemini simplemente no existe por ahora.

Foundation Models Framework: el protocolo LanguageModel

Este es probablemente el anuncio m\u00e1s importante para devs de IA cross-platform. Apple introdujo un protocolo LanguageModel p\u00fablico en Swift que abstrae el proveedor de inferencia:

// Swap de proveedor cambiando una dependencia SPM
// Sin tocar la l\u00f3gica de la app
import FoundationModels

func summarize(_ text: String) async throws -> String {
    let model = LanguageModel.default  // on-device, Gemini o Claude
    return try await model.generate("Resume: \(text)")
}

Funciona as\u00ed:

  • El protocolo define una interfaz com\u00fan para cualquier backend de inferencia.
  • Apple proporciona implementaciones para sus modelos on-device, Gemini y Anthropic Claude.
  • Para cambiar de proveedor, actualizas la dependencia de Swift Package Manager. Tu c\u00f3digo de aplicaci\u00f3n no cambia.
  • Soporta structured outputs, streaming y tool calling.

El framework tambi\u00e9n a\u00f1adi\u00f3 soporte multimodal para im\u00e1genes, BarcodeReaderTool y OCRTool (basados en Vision framework), y un RAG local alimentado por Spotlight que elimina la necesidad de mantener tu propia infraestructura de vectores para casos simples.

Mi lectura: esto es la apuesta de Apple por ser la capa de orquestaci\u00f3n, no el proveedor de modelo. Si el swap entre on-device, Gemini y Claude es transparente, el dev elige por calidad/coste/privacidad caso a caso sin refactorizar. Es un enfoque pragm\u00e1tico que reconoce que Apple no va a ganar la guerra del modelo frontier, pero puede ganar la guerra del DX dentro de su ecosistema.

Core AI: modelos LLM custom on-device

Core AI es el sucesor conceptual de Core ML para el dominio del lenguaje. Donde Core ML estaba optimizado para clasificaci\u00f3n, detecci\u00f3n y modelos cl\u00e1sicos de ML, Core AI est\u00e1 dise\u00f1ado para desplegar LLMs custom en Apple Silicon:

  • Optimizado para memoria unificada y Neural Engine.
  • Permite fine-tuning y servir modelos propios directamente en dispositivo.
  • Elimina la dependencia de API cloud para inferencia de modelos que quepan en el hardware.

Trade-off evidente: el Neural Engine es potente para el factor de forma, pero no compite con un cluster de B200. Los modelos que puedes correr on-device van a estar varios pasos por debajo de un frontier model en calidad. Si tu caso de uso tolera esa diferencia a cambio de latencia zero, coste zero y privacidad total, Core AI tiene sentido. Si no, sigue necesitando una API.

La deprecaci\u00f3n de SiriKit: qu\u00e9 hacer ahora

Apple emiti\u00f3 aviso formal de deprecaci\u00f3n de SiriKit. App Intents es ahora la \u00fanica superficie de integraci\u00f3n con el nuevo Siri.

La diferencia clave:

AspectoSiriKit (deprecated)App Intents (obligatorio)
Definici\u00f3nXML intent filesSwift nativo, metadata generada por compilador
ProcesoIntent Extension separadaRequest directo a la app
DescubrimientoLimitado, dominios fijosEl OS lee metadata sin lanzar la app
Conversaci\u00f3nSingle-shot (tarjeta Siri)Streaming, multi-turno

El riesgo: si tu app no expone acciones via App Intents, es funcionalmente invisible al nuevo Siri. El nuevo Siri encadena acciones entre apps — si la tuya no est\u00e1 en la cadena, no existe.

La ventana de migraci\u00f3n es de 2-3 a\u00f1os (estimada: eliminaci\u00f3n completa en iOS 29, ~2028). El c\u00f3digo legacy compila pero genera warnings de deprecaci\u00f3n y pierde descubrimiento por Siri.

Nuevo: privacy-manifest APIs permiten declarar por intent si los datos se quedan on-device o rutan a la nube. Para apps en sectores regulados (salud, legal, finanzas), esto es relevante.

Xcode 27: IDE agentic con ruta dual

Xcode 27 introduce un sistema de coding agentic con dos motores:

Ruta local: un modelo tuneado para el Neural Engine que ofrece autocompletado predictivo multi-l\u00ednea en tiempo real, sin round-trip a la nube.

Ruta cloud: para an\u00e1lisis pesado (bug-finding estructural, razonamiento multi-fichero), Xcode puede delegar a agentes externos — Anthropic Claude, Google Gemini u OpenAI. El dev elige a d\u00f3nde quiere enviar cada tarea.

Capacidades clave del agente:

  • Simular apps enteras e interactuar con el iOS Simulator via Device Hub.
  • Escribir y ejecutar tests, interactuar con Playgrounds.
  • Canvas que renderiza Markdown junto a cambios de c\u00f3digo y live previews.
  • Integraci\u00f3n de Model Context Protocol (MCP) con 20+ tools cableados al agente.

Mi lectura: Apple est\u00e1 compitiendo con Cursor y Copilot, pero desde dentro del ecosistema. La ventaja es la integraci\u00f3n nativa con el simulador y las APIs de Apple. La limitaci\u00f3n es que si ya usas Claude Code o un agente cross-platform, el value-add de Xcode 27 es marginal salvo que seas 100% Apple-native.

Lo dem\u00e1s: lo que importa menos para devs pero completa el cuadro

Dise\u00f1o: Liquid Glass 2 con slider de transparencia para personalizar intensidad. macOS 27 “Golden Gate” unifica toolbars, sidebars edge-to-edge y redise\u00f1a \u00edconos. La parte relevante: menos ruido visual en el SO, mejor canvas para apps que ocupan pantalla completa.

Rendimiento: 30% m\u00e1s r\u00e1pido en launch de apps, 80% m\u00e1s r\u00e1pido AirDrop, 70% m\u00e1s r\u00e1pido el loading del camera roll. Un scheduler de CPU modificado mejora performance en dispositivos antiguos (iPhone 11+).

Foldable: las APIs de layout adaptativo para SwiftUI y UIKit ya est\u00e1n en el SDK. Detecci\u00f3n de hinge-state, multi-configuraci\u00f3n. Apple espera “reflow fluido” en pantallas flexibles. El iPhone Fold se rumorea para oto\u00f1o 2026.

Compromiso de hardware: iOS 27 soporta iPhone 11+. Las features de Apple Intelligence m\u00e1s potentes requieren iPhone 16+, 15 Pro/Max, M1+ en Mac/iPad. watchOS 27 requiere Series 9 o posterior.

Siri como app standalone: desacoplada del bot\u00f3n lateral, con interfaz dedicada para generaci\u00f3n de texto/im\u00e1genes, an\u00e1lisis de ficheros y queries conversacionales.

SynthID: todas las im\u00e1genes generadas o editadas con Apple Intelligence incluyen watermark de SynthID. Buena se\u00f1al de transparencia.

El mapa competitivo actualizado

AspectoApple (iOS 27/macOS 27)Google (Gemini en Android)Microsoft (Copilot en Windows)
LLM principalGemini (~1.2T) + modelos on-deviceGemini 2.0 (propietario)GPT-4o/OpenAI (partner) + Phi on-device
Orquestaci\u00f3nProtocolo LanguageModelAndroid Agent FrameworkAgent Framework 1.0 (Semantic Kernel)
Swap de proveedoresNativo via SPMLimitadoVia Azure OpenAI
Code genXcode 27 agentic (local + cloud)Gemini Code AssistGitHub Copilot
On-deviceNeural Engine, Core AITensor G5, Android MLNPU Snapdragon/Intel
PrivacidadPrivate Cloud Compute + confidential computingData en Google CloudData en Azure

Apple gana en hardware-software integration y privacidad como marca. Google gana en capability de modelo. Microsoft gana en stack agentic enterprise. Ninguno domina las tres dimensiones.

Restricciones regionales: la realidad inc\u00f3moda

Siri AI no llega a la UE ni China en iOS 27/iPadOS 27. En la UE, el bloqueo viene del Digital Markets Act: reguladores rechazaron las propuestas de Apple para soportar m\u00faltiples asistentes virtuales de forma segura. S\u00ed disponible en macOS 27 y visionOS 27 (plataformas donde el DMA aplica diferente).

Esto crea una situaci\u00f3n absurda: si eres dev europeo, puedes usar el API de Foundation Models en tus apps, pero no puedes probar las features de Siri AI dentro de tu propio dispositivo. Apple dice que trabaja con reguladores, pero no hay timeline.

La lecci\u00f3n: cuando construyes para plataformas controladas por un solo vendor, el regulador puede hacerte invisible sin que el vendor pueda impedirlo.

Qu\u00e9 har\u00eda yo como dev

  1. Migrar SiriKit a App Intents ahora. No esperes al a\u00f1o que viene. Empieza por los 3-5 intents de mayor valor, con soporte streaming y multi-turno. Si no lo haces, tu app desaparece del nuevo Siri.

  2. Prototipar con el protocolo LanguageModel. La combinaci\u00f3n de swap transparente entre on-device y Gemini/Claude es el enfoque m\u00e1s pr\u00e1ctico que he visto para manejar la tensi\u00f3n calidad-privacidad-coste sin duplicar c\u00f3digo.

  3. Evaluar si Core AI reemplaza tu stack actual. Si tu modelo custom cabe en el Neural Engine y tus latencias de inference actuales dependen de red, Core AI te da latencia zero y coste zero. El trade-off de calidad es real, pero para muchos casos de uso productivos es suficiente.

  4. No abandonar tu LLM cloud. Para razonamiento complejo, generaci\u00f3n de contenido y agentes multi-step, Claude/GPT/Gemini v\u00eda API siguen siendo superiores. Lo inteligente es combinar: on-device para lo r\u00e1pido y sensible, cloud para lo pesado. El protocolo LanguageModel hace que esa combinaci\u00f3n sea arquitecturalmente limpia.

  5. Probar Xcode 27 si eres Apple-native. Si tu stack es 100% Apple, el agentic coding con MCP integrado y Device Hub justifica la migraci\u00f3n. Si ya usas Claude Code o Cursor para multi-plataforma, la ganancia marginal es limitada.

Fuentes

Cargando comentarios...