Claude Mythos (Opus 5) Divulgué : Ce Que Nous Savons Pour l'Instant

Le modèle Claude Mythos de nouvelle génération d'Anthropic a été révélé lors d'une fuite de données. Voici ce que les documents divulgués indiquent sur ses capacités en codage, raisonnement et cybersécurité — et ce que cela signifie pour l'IA.

6 min read

Le modèle d’IA le plus puissant d’Anthropic à ce jour vient d’être révélé — non pas lors d’un événement de lancement, mais par une fuite de données. Des documents internes décrivant Claude Mythos (dont le nom de code interne est “Capybara”) ont été exposés suite à une erreur de configuration dans le système de gestion de contenu d’Anthropic, laissant près de 3 000 fichiers accessibles publiquement sans authentification.

Voici ce que nous savons, ce qui reste non confirmé, et pourquoi cela est important.

Ce qui s’est passé

Fin mars 2026, un chercheur en sécurité a découvert qu’un espace de stockage de données mal configuré sur l’infrastructure d’Anthropic exposait des documents internes — des brouillons d’articles de blog, des PDF, des images et des mémos internes — sur l’internet public. Anthropic a rapidement restreint l’accès après en avoir été informé, mais pas avant que les documents ne se propagent sur des forums de sécurité et les réseaux sociaux.

Anthropic a depuis confirmé que la fuite est réelle. Un porte-parole a reconnu que l’entreprise avait terminé l’entraînement d’un modèle appelé Claude Mythos et le testait auprès de clients en accès anticipé, le qualifiant de “changement de paradigme” en matière de performance IA et de “modèle le plus performant que nous ayons jamais construit.”

Qu’est-ce que Claude Mythos ?

Selon les documents divulgués, Claude Mythos se situe au-dessus du niveau Opus actuel — une nouvelle classe de modèle à part entière, pas simplement une nouvelle version. Alors qu’internet l’appelle “Opus 5”, le positionnement interne suggère que Mythos est destiné à être un niveau distinct et supérieur.

Les affirmations clés des documents divulgués :

Programmation et raisonnement

Mythos afficherait des gains de performance majeurs par rapport à Claude Opus 4.6 sur les benchmarks de programmation et les tâches de raisonnement académique. Étant donné qu’Opus 4.6 mène déjà sur SWE-bench Verified (~80,8 %), Terminal-Bench 2.0 et Humanity’s Last Exam, cela implique que Mythos pousse ces chiffres significativement plus haut.

Capacités en cybersécurité

C’est la partie la plus alarmante de la fuite. Les documents internes décrivent Mythos comme étant “actuellement bien en avance sur tout autre modèle d’IA en matière de capacités cyber” — capable de découvrir et d’exploiter des vulnérabilités logicielles à des vitesses bien supérieures à celles des défenseurs humains.

Les documents rapportent que Mythos “présage une vague imminente de modèles capables d’exploiter des vulnérabilités d’une façon qui dépasse largement les efforts des défenseurs” — une évaluation remarquablement candide de la part de l’entreprise qui développe le modèle.

Exploitation par des acteurs étatiques chinois

L’affirmation peut-être la plus explosive : Anthropic aurait découvert qu’un groupe parrainé par l’État chinois avait mené une campagne coordonnée utilisant Claude Code pour infiltrer environ 30 organisations, dont des entreprises technologiques, des institutions financières et des agences gouvernementales. Anthropic a détecté et mis fin à la campagne, mais l’incident semble avoir influencé la stratégie de déploiement prudente de Mythos.

Impact sur les marchés

La fuite a eu des conséquences financières immédiates. Les craintes liées aux cybermenaces alimentées par l’IA ont déclenché une vente massive d’actions de logiciels et de cybersécurité américains. Le sentiment d’aversion au risque s’est répandu sur les marchés des cryptomonnaies, le Bitcoin chutant à 66 000 $. Les médias japonais ont largement couvert les implications de la fuite pour la sécurité nationale.

Ce qui reste non confirmé

Malgré la fuite et la confirmation partielle d’Anthropic, plusieurs questions clés demeurent sans réponse :

  • Les chiffres des benchmarks. Aucun score spécifique n’a été publié. Les affirmations selon lesquelles Mythos dominerait tous les benchmarks sont basées sur des descriptions internes divulguées, et non sur des évaluations tierces vérifiées.
  • Prix et disponibilité. Aucune information sur le prix de l’API, la taille de la fenêtre de contexte ou le calendrier de disponibilité générale.
  • Le nom “Opus 5”. La communauté l’appelle “Opus 5” ou “Claude 5”, mais les documents divulgués positionnent Mythos comme un nouveau niveau au-dessus d’Opus, et non comme un successeur direct. Le nom définitif est inconnu.
  • Observations dans l’interface. Certains utilisateurs signalent avoir vu “Mythos 5 (expérimental)” dans l’interface Claude avec des descriptions “Plus grand et plus intelligent”. Il pourrait s’agir de tests A/B limités, d’artefacts de tests internes, ou de captures d’écran fabriquées. Aucune confirmation généralisée n’existe.

La stratégie de déploiement d’Anthropic

D’après les documents divulgués et les déclarations publiques d’Anthropic, le déploiement sera délibérément prudent :

  1. Les partenaires en cybersécurité en premier. Le groupe d’accès initial est centré sur les chercheurs en sécurité et les défenseurs — l’objectif est de préparer les défenses avant que les capacités offensives du modèle ne soient largement disponibles.
  2. Expansion progressive. Un accès plus large suivra, probablement via l’API et les offres Claude Pro/Team/Enterprise.
  3. Pas de date de lancement publique. Anthropic ne s’est pas engagé sur un calendrier.

Cette approche reflète la façon dont Anthropic a géré les versions précédentes où les préoccupations de sécurité étaient élevées — lente, contrôlée, avec des cas d’usage défensifs prioritaires.

Ce que cela signifie

Qu’on l’appelle Opus 5, Mythos ou Capybara, les implications sont significatives :

Pour les développeurs : Un modèle qui surpasse véritablement Opus 4.6 en matière de programmation serait un outil majeur pour le développement logiciel, le débogage et les workflows agentiques. La question est de savoir quand il deviendra disponible et à quel prix.

Pour la cybersécurité : Les documents divulgués dressent le portrait d’un modèle d’IA capable de trouver et d’exploiter des vulnérabilités plus vite que les humains ne peuvent les corriger. Si c’est exact, cela modifie fondamentalement le paysage de la cybersécurité — les défenseurs auront besoin d’outils alimentés par l’IA simplement pour rester dans la course.

Pour la sécurité de l’IA : Le fait qu’Anthropic reconnaisse publiquement que son propre modèle représente des risques pour la cyberdéfense est notable. Le déploiement prudent suggère que l’entreprise prend au sérieux sa Politique de mise à l’échelle responsable, mais cela soulève également des questions sur la capacité d’un déploiement échelonné à véritablement contenir des capacités une fois qu’elles sont mises en production.

Pour l’industrie : Si Mythos tient les promesses des documents divulgués, il établit un nouveau standard pour les modèles d’IA de pointe. Les concurrents devront répondre — et les implications en matière de cybersécurité accéléreront probablement les discussions réglementaires.

En résumé

La fuite de Claude Mythos est réelle. Anthropic a confirmé l’existence du modèle et le fait qu’il représente un bond significatif en termes de capacités. Mais les détails — benchmarks, prix, disponibilité, capacités exactes — restent non vérifiés au-delà de ce qui figurait dans les documents internes divulgués.

Pour l’instant, voici ce que nous savons : un modèle de nouvelle génération confirmé par Anthropic, des documents internes suggérant des capacités sans précédent (notamment en cybersécurité), un plan de déploiement prudent, et beaucoup de spéculations pour combler les lacunes.

Nous mettrons à jour cet article au fur et à mesure qu’Anthropic fera des annonces officielles. En attendant, Claude Opus 4.6 et Sonnet 4.6 restent les modèles Claude publiquement disponibles les plus performants — et ils sont déjà remarquablement puissants pour la programmation, le raisonnement et les tâches complexes.