← Blog

Claude Mythos (Opus 5) filtrado: Lo que sabemos hasta ahora

El modelo Claude Mythos de próxima generación de Anthropic fue revelado en una filtración de datos. Esto es lo que dicen los documentos filtrados sobre sus capacidades en programación, razonamiento y ciberseguridad, y lo que significa para la IA.

6 min read

El modelo de IA más poderoso de Anthropic hasta la fecha ha sido revelado — no a través de un evento de lanzamiento, sino mediante una filtración de datos. Documentos internos que describen a Claude Mythos (con nombre en clave interno “Capybara”) quedaron expuestos después de que un error de configuración en el sistema de gestión de contenidos de Anthropic dejara casi 3,000 archivos accesibles públicamente sin autenticación.

Esto es lo que sabemos, lo que aún no está confirmado y por qué importa.

Qué Ocurrió

A finales de marzo de 2026, un investigador de seguridad descubrió que un almacén de datos mal configurado en la infraestructura de Anthropic exponía documentos internos — borradores de publicaciones de blog, PDFs, imágenes y memorandos internos — a la internet pública. Anthropic bloqueó rápidamente el acceso tras ser notificada, pero no antes de que los documentos se difundieran en foros de seguridad y redes sociales.

Anthropic ha confirmado desde entonces que la filtración es real. Un portavoz reconoció que la empresa ha completado el entrenamiento de un modelo llamado Claude Mythos y lo está probando con clientes de acceso anticipado, calificándolo como “un cambio sustancial” en el rendimiento de la IA y “el más capaz que hemos construido hasta la fecha.”

¿Qué Es Claude Mythos?

Según los documentos filtrados, Claude Mythos se sitúa por encima del nivel Opus actual — una nueva clase de modelo por completo, no simplemente otra actualización de versión. Aunque en internet se le ha denominado “Opus 5”, el posicionamiento interno sugiere que Mythos está concebido como un nivel separado y superior.

Las principales afirmaciones de los materiales filtrados:

Programación y Razonamiento

Se informa que Mythos ofrece importantes mejoras de rendimiento respecto a Claude Opus 4.6 en benchmarks de programación y tareas de razonamiento académico. Dado que Opus 4.6 ya lidera en SWE-bench Verified (~80.8%), Terminal-Bench 2.0 y Humanity’s Last Exam, la implicación es que Mythos eleva estas cifras de forma significativa.

Capacidades de Ciberseguridad

Esta es la parte más alarmante de la filtración. Los documentos internos describen a Mythos como “actualmente muy por delante de cualquier otro modelo de IA en capacidades cibernéticas” — capaz de descubrir y explotar vulnerabilidades de software a velocidades que superan con creces a los defensores humanos.

Los documentos supuestamente advierten que Mythos “presagia una próxima ola de modelos que pueden explotar vulnerabilidades de maneras que superan ampliamente los esfuerzos de los defensores” — una evaluación notablemente franca de la propia empresa que construye el modelo.

Explotación Patrocinada por el Estado Chino

Quizás la afirmación más explosiva: según los informes, Anthropic descubrió que un grupo patrocinado por el estado chino había llevado a cabo una campaña coordinada utilizando Claude Code para infiltrarse en aproximadamente 30 organizaciones, incluyendo empresas tecnológicas, instituciones financieras y organismos gubernamentales. Anthropic detectó y detuvo la campaña, pero el incidente parece haber influido en la cautelosa estrategia de lanzamiento de Mythos.

Impacto en el Mercado

La filtración tuvo consecuencias financieras inmediatas. Las preocupaciones sobre las amenazas cibernéticas impulsadas por IA desencadenaron una venta masiva en acciones de software y ciberseguridad de EE. UU. El sentimiento de aversión al riesgo se extendió a los mercados de criptomonedas, con Bitcoin cayendo a $66,000. Los medios japoneses informaron extensamente sobre las implicaciones de seguridad nacional de la filtración.

Lo Que Aún No Está Confirmado

A pesar de la filtración y la confirmación parcial de Anthropic, varias preguntas clave permanecen sin respuesta:

  • Cifras de benchmark. No se han publicado puntuaciones específicas. Las afirmaciones sobre Mythos dominando todos los benchmarks se basan en descripciones internas filtradas, no en evaluaciones verificadas por terceros.
  • Precios y disponibilidad. No hay información sobre precios de API, tamaño de la ventana de contexto o plazos de disponibilidad general.
  • Nombre “Opus 5”. La comunidad lo ha llamado “Opus 5” o “Claude 5”, pero los documentos filtrados posicionan a Mythos como un nuevo nivel por encima de Opus, no como un sucesor directo. El nombre definitivo se desconoce.
  • Avistamientos en la interfaz. Algunos usuarios informan haber visto “Mythos 5 (experimental)” en la interfaz de Claude y descripciones como “Más grande y más inteligente”. Estos podrían ser pruebas A/B limitadas, artefactos de pruebas internas o capturas de pantalla fabricadas. No existe confirmación generalizada.

Estrategia de Lanzamiento de Anthropic

Basándose en los documentos filtrados y las declaraciones públicas de Anthropic, el lanzamiento será deliberadamente cauteloso:

  1. Primero, socios de ciberseguridad selectos. El grupo de acceso inicial está enfocado en investigadores de seguridad y defensores — el objetivo es preparar las defensas antes de que las capacidades ofensivas del modelo estén ampliamente disponibles.
  2. Expansión por etapas. El acceso más amplio seguirá, presumiblemente a través de la API y los planes Claude Pro/Team/Enterprise.
  3. Sin fecha de lanzamiento público. Anthropic no se ha comprometido con un calendario.

Este enfoque refleja cómo Anthropic manejó versiones anteriores donde las preocupaciones de seguridad eran elevadas — lento, controlado, con casos de uso defensivos priorizados.

Qué Significa Todo Esto

Ya sea que lo llame Opus 5, Mythos o Capybara, las implicaciones son significativas:

Para desarrolladores: Un modelo que supere significativamente a Opus 4.6 en programación sería una herramienta importante para el desarrollo de software, la depuración de código y los flujos de trabajo agénticos. La pregunta es cuándo estará disponible y a qué precio.

Para la ciberseguridad: Los documentos filtrados pintan el panorama de un modelo de IA capaz de encontrar y explotar vulnerabilidades más rápido de lo que los humanos pueden parchearlas. Si es preciso, esto cambia el panorama de la ciberseguridad de manera fundamental — los defensores necesitarán herramientas impulsadas por IA simplemente para mantenerse al día.

Para la seguridad de la IA: El reconocimiento público de Anthropic de que su propio modelo representa riesgos para la defensa cibernética es notable. El lanzamiento cauteloso sugiere que la empresa toma en serio su Política de Escalado Responsable, pero también plantea preguntas sobre si algún lanzamiento gradual puede verdaderamente contener las capacidades una vez desplegadas.

Para la industria: Si Mythos cumple con las afirmaciones de los documentos filtrados, establece un nuevo estándar para los modelos de IA de frontera. Los competidores deberán responder — y las implicaciones de ciberseguridad probablemente acelerarán las conversaciones regulatorias.

La Conclusión

La filtración de Claude Mythos es real. Anthropic ha confirmado que el modelo existe y que representa un salto significativo en capacidades. Pero los detalles — benchmarks, precios, disponibilidad, capacidades exactas — permanecen sin verificar más allá de lo que figuraba en los documentos internos filtrados.

Por ahora, lo que tenemos es: un modelo de próxima generación confirmado de Anthropic, documentos internos que sugieren capacidades sin precedentes (especialmente en ciberseguridad), un plan de lanzamiento cauteloso y mucha especulación llenando los vacíos.

Actualizaremos este artículo cuando Anthropic haga anuncios oficiales. Mientras tanto, Claude Opus 4.6 y Sonnet 4.6 siguen siendo los modelos Claude más capaces disponibles públicamente — y ya son extraordinariamente potentes para programación, razonamiento y tareas complejas.