Radar IA Semanal: Grok V9 a 1.5T params, Apple abre Siri a terceros y Anthropic comercializa Mythos

Qué pasó

Grok V9-Medium terminó pre-entrenamiento. Elon Musk confirmó el 25 de mayo que el nuevo modelo de xAI tiene 1.5 billones de parámetros — 3x más que el actual V8-small (~0.5T). El fine-tuning está en curso y el RL empieza en días. Musk añadió que incorporaron “muchos datos de Cursor” para optimizar coding. Release esperado: mediados de junio. Benchmarks oficiales: cero por ahora. Solo un “evals look good” que no dice mucho.

WWDC 2026 se perfila como el keynote de IA de Apple. El 8-12 de junio, Apple espera presentar: Siri 2.0 con interfaz chatbot, CoreAI (reemplazo de CoreML para genAI), Extensions Framework (Siri con backends de Claude/ChatGPT/Grok intercambiables), SDK para agentes de terceros, y chip M5 con 3.5x más rendimiento AI. El mínimo para Apple Intelligence sube a 12GB RAM. Apple NO adopta MCP ni A2A — van con su propio stack basado en Intents/App Intents.

Cohere absorbe Aleph Alpha en una fusión valorada en 20B USD. Lo que se anunció como “merger” es de facto una adquisición: Cohere retiene ~90% del combined entity. Aleph Alpha aporta contratos con el gobierno alemán, SAP, Bosch, experiencia regulatoria con la EU AI Act (agosto 2026) y ~250 personas. STACKIT (Schwarz Group) será la infra europea con ~100K GPUs planificadas en Lübbenau. Pendiente de aprobación regulatoria en Canadá y Alemania.

Anthropic empieza a comercializar Claude Mythos. Desde el lanzamiento del Project Glasswing (7 de abril), Mythos encontró 10K+ vulnerabilidades de alta/crítica severidad en software open-source. Anthropic lo está integrando en Claude Code y Claude Security (beta pública para Enterprise). El modelo es vertical de ciberseguridad — no es Opus afinado, fue construido desde cero. Pricing no anunciado oficialmente, pero Anthropic admitió que “es muy caro de servir”. Estimaciones: 2-5x el precio de Opus 4.7.

Claude Code se actualizó con Managed Agents y Plugin Marketplace. En el evento “Code with Claude” (6 de mayo), Anthropic anunció: Managed Agents con “Dreaming” (agentes que revisan sus propias conversaciones), Orquestación multi-agente (hasta 20 IDs, 25 threads concurrentes), Plugin Marketplace, soporte para Opus 4.7 con contexto nativo de 1M tokens, y duplicación de los rate limits. Claude Sonnet 4 y Opus 4 se retiran el 15 de junio de 2026.

Por qué importa

Grok V9-Medium es la apuesta de xAI por el mercado de coding. 1.5T params con datos de Cursor es una combinación concreta: quieren quitarle terreno a Claude Code y GitHub Copilot. Pero xAI tiene problemas serios: 50+ investigadores se fueron, ~14B USD/año de burn rate, solo 6% de market share enterprise. El modelo puede ser bueno; la pregunta es si la empresa sobrevive lo suficiente para que importe. Sin benchmarks y sin pricing, es promesa, no producto.

Apple abrió la caja de Pandora con las extensiones de Siri. Permitir que elijas Claude, ChatGPT o Grok como backend de Siri es un giro filosófico enorme. Apple, que siempre fue ecosistema cerrado, ahora acepta que no puede competir en modelo frontier y prefiere ser plataforma. CoreAI como reemplazo de CoreML es la parte técnica: Swift-native, LoRA fine-tuning on-device, @Generable para structured output, cero coste por token. Pero no adoptar MCP/A2A es una señal de Apple queriendo controlar el stack. Si eres dev de IA en iOS, esto cambia tu roadmap de 2026.

Cohere + Aleph Alpha = IA soberana como categoría de inversión. 20B USD de valoración combinada no es porque los modelos sean mejores que GPT-5 o Claude. Es porque gobiernos europeos y empresas reguladas (defensa, sanidad, finanzas) no pueden mandar datos sensibles a servidores bajo la US CLOUD Act. La EU AI Act de agosto 2026 aprieta más. El trade-off es claro: pagas 2-5x más por la API a cambio de cumplimiento legal. Si trabajas en sector público europeo, esto te afecta directamente.

Mythos cambia la dinámica ataque-defensa. HackerOne lo describió como “colapsa el buffer de vulnerabilidad”: el tiempo entre descubrimiento y explotación se acerca a cero. Anthropic encontró 10K+ vulnerabilidades en semanas con un modelo que no es público. Cuando se comercialice, tanto atacantes como defensores tendrán acceso a la misma capacidad. Mi lectura: Mythos acelera la carrera ofensiva más de lo que la defensiva puede compensar. El resultado neto a corto plazo es más riesgo, no menos.

Claude Code madura como plataforma, no solo herramienta. Managed Agents con coordinador-subagente, Plugin Marketplace, /goal para tareas autónomas multi-turno… Claude Code ya no es solo “un CLI que escribe código”. Es un runtime para agentes de desarrollo. La duplicación de rate limits sugiere que Anthropic ve el uso productivo aumentando. La retirada de Sonnet 4 y Opus 4 (15 de junio) fuerza migración a Sonnet 4 actualizado u Opus 4.7. Si usas Anthropic en producción, revisa tus dependencias.

A quién afecta

Devs que usan xAI API: Grok V9-Medium puede cambiar tu routing si los benchmarks confirman calidad competitiva. Pero no migres producción hasta que haya números reales y pricing publicado.
Devs iOS/macOS: WWDC redefine tu stack de IA. CoreAI reemplaza CoreML. Prepárate para rewrite de integraciones. Las extensiones de terceros abren oportunidades si construyes herramientas AI-native.
Empresas europeas y gobierno: Cohere/Aleph Alpha ofrecen una alternativa real a US cloud. Si tu organización maneja datos bajo regulación europea, evalúa el coste vs. riesgo de no cumplimiento.
Equipos de seguridad: Mythos llega a Claude Code y Claude Security. Si tu stack usa Anthropic, prepárate para capacidades de escaneo de vulnerabilidades integradas. Si no, prepárate para que tus atacantes las tengan.
Usuarios de Claude Code: Actualiza y migra antes del 15 de junio. Opus 4 y Sonnet 4 original desaparecen. Evalúa si Managed Agents merece tu tiempo para automatizar workflows.

Qué haría yo

No cambiar routing por Grok todavía. 1.5T params sin benchmarks es marketing. Espera a que salga, pruébalo en tareas específicas, compara con Claude Code y GPT-5, y solo entonces ajusta.
Preparar el stack de Apple para WWDC. Si desarrollas para iOS/macOS, revisa los docs de CoreAI cuando se publiquen. Las APIs Swift-native para genAI on-device con cero coste por token son concretamente útiles. Pero no escribas código contra leaks — espera al SDK oficial.
Evaluar Cohere si estás en sector regulado europeo. Si tu organización tiene requisitos de soberanía de datos, Cohere/Aleph Alpha es ahora la opción más seria. Pide pricing, prueba Command R+ contra tus use cases, compara con Microsoft Azure EU. El premium de 2-5x puede merecer la pena si evitas multas de la EU AI Act.
Revisar seguridad antes y después de Mythos. Si Anthropic te da acceso a Mythos vía Claude Security, úsalo en staging primero. Si no tienes acceso, escanea con herramientas open-source (Semgrep, CodeQL) y asume que tus atacantes usarán Mythos. La ventaja defensiva es temporal.
Migrar Anthropic antes del 15 de junio. Opus 4 → Opus 4.7. Sonnet 4 → Sonnet 4 (nuevo). Actualizar variables de entorno, probar en staging, revisar que el comportamiento es equivalente. Los breaking changes de modelos son silenciosos pero peligrosos.

Señales que estoy vigilando

Benchmarks de Grok V9-Medium: Si SWE-benchVerified >80%, es competidor real. Si <70%, es ruido.
WWDC CoreAI pricing model: Si Apple cobra por uso de modelos on-device, cambia la ecuación. Si es gratis como CoreML, domina.
Aprobación regulatoria Cohere/Aleph Alpha: Si Alemania bloquea, se frenan las fusiones de IA soberana en Europa.
Mythos pricing oficial: Determina si es herramienta de enterprise premium o se democratiza.
Retirada de Claude Sonnet 4 / Opus 4: Verificar estabilidad de Opus 4.7 y Sonnet 4 nuevo antes de migrar producción.

Próximo radar: 6 de junio. RSS para actualizaciones semanales.