Qu'est-ce que Claude Mythos ? Fuite, niveau Capybara et ce qu'Anthropic a confirmé

Claude Mythos est le modèle de nouvelle génération fuité d'Anthropic. Voici ce que la violation de données a révélé et ce que la société a officiellement confirmé.

12 min read
Qu'est-ce que Claude Mythos ? Fuite, niveau Capybara et ce qu'Anthropic a confirmé

Je parcourais mon fil d’actualité le matin quand un titre de Fortune m’a stoppé net : Anthropic avait accidentellement laissé près de 3 000 fichiers internes dans un espace de stockage de données accessible publiquement — dont un brouillon d’article de blog annonçant leur prochain modèle. Au moment où j’ai cliqué, l’histoire s’était déjà répandue partout. Le nom du modèle : ​Claude Mythos​. Le nom de niveau interne associé : ​Capybara​. Et le brouillon d’Anthropic lui-même le qualifiait de « modèle d’IA de loin le plus puissant que nous ayons jamais développé ».

Je m’appelle Dora. Cet article est un résumé factuel à l’intention des développeurs et des responsables de produits IA qui ont besoin d’une lecture lucide de ce qui a été réellement confirmé, de ce qui provient du brouillon divulgué, et de ce qui reste inconnu. Il n’y a pas encore de chiffres officiels de benchmarks à citer — et je n’en inventerai pas.

Ce que la fuite de données Claude Mythos a réellement révélé

Qui l’a trouvé et comment

La fuite provient d’une erreur de configuration dans le système de gestion de contenu d’Anthropic. La mauvaise configuration du CMS a laissé près de 3 000 ressources non publiées dans un espace de stockage de données accessible et consultable publiquement. Deux chercheurs en sécurité ont indépendamment localisé le matériel exposé : Roy Paz de LayerX Security et Alexandre Pauwels de l’Université de Cambridge ont découvert l’espace de stockage exposé, qui contenait un brouillon d’article de blog décrivant le modèle en détail. Fortune a examiné les documents et notifié Anthropic, après quoi l’accès a été restreint.

Anthropic a attribué l’incident à une « erreur humaine » dans la configuration du CMS et a décrit le matériel exposé comme des « brouillons précoces de contenu envisagé pour publication ». Une deuxième fuite distincte a suivi quelques jours plus tard : Anthropic a accidentellement téléchargé l’intégralité du code source original de Claude Code sur NPM au lieu de la version compilée uniquement, exposant environ 500 000 lignes de code réparties sur près de 1 900 fichiers. Cette deuxième fuite a fourni une corroboration supplémentaire que le modèle Capybara était activement en préparation.

Ce que contenait le brouillon exposé

Il existait en réalité deux versions du même article de blog qui ne différaient que par le nom du modèle : « Mythos » (v1) et « Capybara » (v2). Dans la version Capybara, le nom était remplacé tout au long du titre et du corps du texte, mais le sous-titre indique toujours : « Nous avons terminé l’entraînement d’un nouveau modèle d’IA : Claude Mythos. » Anthropic a déclaré à Fortune que les documents étaient des « brouillons précoces de contenu envisagé pour publication », suggérant que l’entreprise était encore en train de choisir entre des noms candidats pour le même modèle.

Le brouillon décrivait également une stratégie de déploiement. Selon les documents, Anthropic prévoit une mise en production délibérément plus lente qu’avec les modèles précédents, en commençant par un petit groupe de clients à accès anticipé chargés d’évaluer les applications de cybersécurité, avec un accès via l’API Claude se développant progressivement. Le brouillon reconnaissait également que le modèle est « très coûteux à servir » et qu’Anthropic travaille à le rendre « beaucoup plus efficace avant toute mise en production générale ».

Claude Mythos vs Capybara — même modèle, deux noms

Ce que Capybara signifie comme nouveau niveau

C’est le point structurel le plus important à bien comprendre. Mythos et Capybara ne sont pas deux modèles différents. « Claude Mythos » est le nom du produit/génération (comme « Claude 4 »), tandis que « Capybara » est le nom du niveau (comme Haiku, Sonnet, Opus). La désignation complète serait quelque chose comme « Claude Mythos Capybara ».

La distinction de niveau est importante car elle représente un changement dans l’architecture de la gamme de modèles d’Anthropic. Actuellement, les niveaux de modèles d’Anthropic vont de Haiku (le plus petit, le plus rapide, le moins cher) en passant par Sonnet jusqu’à Opus (le plus capable). Capybara ajouterait un quatrième niveau, plus coûteux, au-dessus des trois — « plus grand et plus intelligent que nos modèles Opus — qui étaient, jusqu’à présent, nos plus puissants », selon le brouillon divulgué.

Il s’agit d’une expansion structurelle, pas seulement d’un incrément de version. Pensez-y moins comme à « Opus 5 » et plus comme à une nouvelle catégorie de produit qui se situe au-dessus de la gamme existante.

Comment le naming pourrait évoluer avant le lancement public

Les deux versions du brouillon utilisent la même justification pour le nom, affirmant qu’il a été choisi pour évoquer « le tissu conjonctif profond qui relie entre eux connaissances et idées ». Que le modèle soit commercialisé sous le nom de « Claude Mythos », « Claude Capybara » ou sous un tout autre nom public n’a pas été confirmé. Le fait que deux brouillons existent — l’un nommé Mythos, l’autre Capybara — indique que c’était encore en suspens au moment de la fuite.

« Claude Mythos 5 » n’est pas un nom officiel. Il a circulé dans les articles comme raccourci, mais n’apparaît ni dans les documents divulgués ni dans aucune déclaration d’Anthropic. Ne le traitez pas comme une désignation confirmée.

Capacités revendiquées vs Claude Opus 4.6

Toutes les revendications de capacités ci-dessous proviennent du brouillon d’article de blog divulgué et sont attribuées en conséquence. Aucun benchmark officiel n’a été publié par Anthropic en date d’avril 2026.

Codage et raisonnement agentique

Selon le brouillon divulgué, « Comparé à notre meilleur modèle précédent, Claude Opus 4.6, Capybara obtient des scores nettement plus élevés sur les tests de codage logiciel, de raisonnement académique et de cybersécurité, entre autres. » Le brouillon ne donne pas de chiffres de benchmark spécifiques — seulement le qualificatif « nettement plus élevés ». Aucune reproduction externe de ces scores n’existe encore.

La revendication d’un meilleur raisonnement agentique est cohérente avec la trajectoire de la famille de modèles Claude existante, qui a progressivement étendu l’utilisation d’outils et la gestion de tâches en plusieurs étapes. L’adoption rapide de Claude Code en entreprise était déjà construite sur les capacités agentiques d’Opus 4.6 ; Mythos étendrait vraisemblablement cela encore davantage.

Améliorations du raisonnement académique

Le brouillon divulgué liste le raisonnement académique comme l’un des domaines de performance « nettement plus élevée » par rapport à Opus 4.6. Aucun détail sur les benchmarks spécifiques (GPQA, MMLU, MATH, etc.) ni sur les plages de scores revendiqués n’a émergé dans les reportages vérifiés. C’est un domaine où l’absence de chiffres officiels est importante : prendre des décisions sur la base de revendications de benchmarks non vérifiées provenant d’un document brouillon comporte un risque d’évaluation réel.

Performances en cybersécurité — et pourquoi cela suscite des inquiétudes

C’est là que la fuite a généré le plus de discussion — et le plus de prudence. Le brouillon divulgué déclarait que le modèle « présage une vague imminente de modèles capables d’exploiter des vulnérabilités d’une manière qui dépasse de loin les efforts des défenseurs ».

Les documents divulgués décrivent Mythos comme actuellement bien en avance sur tout autre modèle d’IA en matière de capacités cyber, soulevant de sérieuses préoccupations d’utilisation duale. La déclaration d’Anthropic elle-même reconnaissait directement le risque : « En préparant la mise en production de Claude Capybara, nous voulons agir avec une prudence particulière et comprendre les risques qu’il pose — même au-delà de ce que nous apprenons dans nos propres tests. »

Le contexte ici n’est pas abstrait. Anthropic a précédemment signalé qu’un groupe parrainé par l’État chinois avait déjà mené une campagne coordonnée utilisant Claude Code pour infiltrer environ 30 organisations — dont des entreprises technologiques, des institutions financières et des agences gouvernementales — avant que l’entreprise ne le détecte. Les capacités de cybersécurité revendiquées de Mythos amplifient considérablement ce profil de risque d’utilisation duale, ce qui constitue un facteur direct de la stratégie de déploiement prudente.

Pour les équipes qui intègrent des modèles de pointe dans des outils de sécurité, c’est un facteur réel — pas seulement du langage réglementaire. Il vaut la peine d’examiner la politique d’utilisation d’Anthropic avant de créer des applications liées à la cybersécurité sur les modèles actuels ou futurs dès maintenant.

Disponibilité actuelle : qui peut y accéder maintenant

Détails du programme d’accès anticipé

Anthropic travaille avec un petit groupe de clients à accès anticipé pour tester le modèle. Le brouillon divulgué indique que ce groupe est spécifiquement axé sur l’évaluation des applications de cybersécurité, ce qui suggère que le groupe d’accès anticipé a été sélectionné sur la base d’une expertise pertinente dans le domaine plutôt que sur la taille du client seule.

Selon les informations produit divulguées destinées aux clients à accès anticipé, le nouveau modèle pourrait être utilisé par des acteurs malveillants pour mettre en œuvre des attaques plus puissantes. La conception de l’accès anticipé est en partie une évaluation des risques contrôlée, pas seulement un aperçu des fonctionnalités.

Il n’y a pas de liste d’attente publique, pas de processus de candidature annoncé, et aucun calendrier confirmé pour l’expansion au-delà du groupe initial. Si vous avez vu des sites tiers proposant un « accès Capybara », ceux-ci ne sont pas affiliés à Anthropic.

Aucune API publique ni date de mise en production confirmée

La déclaration officielle d’Anthropic est la seule position publique confirmée : « Nous développons un modèle à usage général avec des avancées significatives en raisonnement, codage et cybersécurité. Compte tenu de la puissance de ses capacités, nous sommes délibérés dans la façon dont nous le mettons en production. »

Pas d’endpoint API, pas de tarification, pas de trimestre de mise en production. Le brouillon notait que le modèle est « coûteux à faire fonctionner » et pas encore optimisé pour une disponibilité générale. Pour les équipes qui planifient des feuilles de route autour de ce modèle, la réponse honnête est : il n’y a pas encore de date sur laquelle planifier.

Ce que cela signifie pour les équipes évaluant les modèles de pointe

Quelques points sur lesquels il vaut la peine de réfléchir si vous faites de l’évaluation de modèles pour des décisions produit ou d’infrastructure :

L’ambiguïté des noms est un problème pratique. Si votre cadre d’évaluation fait référence à « Claude Mythos 5 » ou traite Capybara comme un produit public confirmé, vous construisez sur un langage de brouillon qu’Anthropic peut changer entièrement avant le lancement. Gardez votre documentation interne flexible sur le naming jusqu’à ce qu’il y ait une mise en production officielle.

La revendication de capacités en cybersécurité change le calcul des risques pour certains cas d’usage. Si votre application touche à l’analyse de vulnérabilités, aux tests de pénétration ou à l’analyse de sécurité du code, les capacités revendiquées de Mythos augmentent à la fois les avantages et la charge de conformité. Commencez à évaluer cela maintenant plutôt qu’après l’ouverture de l’accès.

Claude Opus 4.6 reste l’option de niveau production. Pour les équipes qui ont besoin de livrer aujourd’hui, Opus 4.6 est toujours le fleuron publiquement disponible d’Anthropic et fonctionne bien sur les tâches de raisonnement complexe. Courir après un modèle non publié pour des projets actuels n’a pas de sens. Consultez la documentation du modèle actuel d’Anthropic pour les accès API et les spécifications de capacités.

La situation de double fuite est un signal, pas seulement une histoire. Deux divulgations non intentionnelles majeures en une semaine — des fichiers CMS et le code source de Claude Code — suggèrent que la coordination interne de la mise en production est sous pression. Le modèle pourrait être plus proche du lancement qu’une posture publique prudente ne le laisse entendre. Ou il pourrait être mis en production beaucoup plus tard si les tests de sécurité soulèvent des problèmes. Aucune interprétation n’est fausse ; l’incertitude est l’état réel des choses.

FAQ

Claude Mythos est-il disponible publiquement ?

Non. En date d’avril 2026, Claude Mythos / Capybara n’est disponible que pour un petit groupe de clients à accès anticipé sélectionnés par Anthropic. Il n’y a pas d’API publique, pas de tarification annoncée et pas de date de mise en production confirmée.

Comment se compare-t-il à Opus 4.6 ?

Selon le brouillon d’article de blog divulgué, Capybara obtient des scores « nettement plus élevés » que Claude Opus 4.6 sur les benchmarks de codage logiciel, de raisonnement académique et de cybersécurité. Aucun chiffre spécifique n’a été publié. Toutes les comparaisons de capacités proviennent actuellement de cette source de brouillon, et non de publications officielles de benchmarks.

Y aura-t-il une API Claude Mythos publique ?

Vraisemblablement oui à un moment donné — le brouillon divulgué décrivait un déploiement progressif via l’API Claude — mais aucun calendrier n’a été confirmé. Le modèle est actuellement décrit comme coûteux à servir et pas encore optimisé pour une disponibilité générale. Surveillez le canal d’actualités officiel d’Anthropic pour les annonces.

Articles précédents :