Claude Opus 4.8 vs Claude Mythos : Disponible vs Aperçu

Je m’appelle Dora. Deux personnes m’ont posé la même question la semaine dernière : “Devrais-je migrer notre pipeline vers Claude Mythos, ou attendre Opus 4.8 ?” Les deux avaient la mauvaise approche. Mythos n’est pas un modèle que vous choisissez à côté d’Opus dans la console API. Opus 4.8 est désormais le flagship disponible par défaut selon l’article de lancement Opus 4.8 d’Anthropic ; la préversion est derrière une liste d’invitation. Si vous êtes un développeur qui évalue l’un ou l’autre pour la production, cet article explique pourquoi cette distinction est importante avant d’écrire une seule ligne de code de routage.

Pas de spéculation sur les performances de la préversion que je n’ai pas testée.

Claude Opus 4.8 vs Claude Mythos en un coup d’œil

Version publique vs préversion de recherche restreinte

Deux catégories différentes. C’est tout l’enjeu.

Opus 4.8 a été lancé le 28 mai 2026. Disponibilité générale. Tarification standard, identifiant API standard claude-opus-4-8, flux de paiement standard. Si vous aviez une intégration Opus 4.7 le jeudi matin, vous aviez la 4.8 le jeudi après-midi — même endpoint, même documentation, modifications additives uniquement.

Mythos Preview, c’est autre chose. Anthropic le décrit comme une préversion de recherche restreinte distribuée via Project Glasswing, une coalition de cybersécurité défensive. Disponible depuis avril 2026, mais “disponible” signifie ici accessible à environ 50 organisations vérifiées — AWS, Apple, Google, Microsoft, Cloudflare, CrowdStrike, la Linux Foundation, et une quarantaine d’autres gérant des infrastructures critiques. Anthropic a déclaré ne pas prévoir de rendre la préversion disponible au grand public.

Donc lorsque quelqu’un compare les deux, il ne compare pas des produits entre lesquels vous pouvez choisir. Il compare ce qui vous est expédié à ce qui est expédié à une liste fermée.

Disponibilité pour les développeurs et chemins d’accès

Fonctionnalité	Claude Opus 4.8	Claude Mythos Preview
Statut	Disponibilité générale	Préversion de recherche restreinte
Accès	API en libre-service, claude.ai, Claude Code	Sur invitation uniquement via Project Glasswing
Plateformes	Claude API, Bedrock, Vertex AI, Foundry	Les quatre mêmes plateformes, restreintes
Cadre d’utilisation	Flagship polyvalent	Recherche en cybersécurité défensive
Adéquation production	Oui	Non — préversion, pas en disponibilité générale

Il n’existe pas de chemin de candidature au sens conventionnel. Un programme de vérification cyber existe pour les équipes de sécurité qualifiées, mais ce n’est pas une liste d’attente qui se convertit en accès général. Veuillez vous référer à la documentation officielle la plus récente d’Anthropic pour les critères d’accès actuels — cette politique est mise à jour sans beaucoup de préavis.

Ce qu’Anthropic a confirmé sur Opus 4.8

Disponibilité API, statut tarifaire et orientation des benchmarks

La surface factuelle est nette. Anthropic a lancé Claude opus 4.8 au même tarif que la 4.7 — $5 par million de tokens en entrée, $25 par million en sortie — sur l’API Claude, Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry. La fenêtre contextuelle de 1M de tokens est reconduite (200K sur Foundry au lancement). Je ne vais pas répéter chaque graphique de l’article de lancement ; consultez la documentation de l’API Claude pour Opus 4.8. Les éléments qui ont réellement modifié le comportement des développeurs :

Le curseur d’effort visible dans claude.ai, pas seulement en tant que paramètre API. Niveaux : faible → moyen → élevé (par défaut) → très élevé → maximum. Sur les tâches de codage, le niveau élevé par défaut consomme à peu près le même nombre de tokens que le défaut de la 4.7 mais avec de meilleures performances.
Mode rapide en préversion de recherche : vitesse de sortie ~2,5x plus élevée à $10/$50 par million de tokens.
Workflows dynamiques dans Claude Code (préversion de recherche), orchestrant des centaines de sous-agents en parallèle.
Messages système en milieu de conversation dans l’API Messages — petite amélioration mais utile pour les agents de longue durée.

Sur le front des benchmarks d’opus 4.8, Anthropic rapporte SWE-bench Pro à 69,2 % (contre 64,3 %) et des gains similaires sur le codage agentique, le raisonnement multidisciplinaire et les évaluations scientifiques. Je n’ai pas relancé ces tests sur ma propre charge de travail. L’amélioration de l’honnêteté — Anthropic affirme environ 4 fois moins susceptible de laisser passer des défauts sans les signaler — est celle qui m’intéresse, car c’est le type de régression qui ne coûte rien sur un classement mais qui coûte vraiment de l’argent en production. À vérifier.

Une note tarifaire enfouie dans l’annonce : le mode rapide est environ trois fois moins cher que le mode rapide des modèles précédents. Si vous l’aviez rejeté comme trop coûteux avec la 4.7, le calcul est différent maintenant.

Ce qu’Anthropic a confirmé sur Claude Mythos Preview

Project Glasswing, utilisation pour la sécurité défensive et accès restreint

La préversion est sortie de l’ombre le 7 avril 2026, aux côtés de Project Glasswing. Le cadre est spécifique : programme de cybersécurité défensive, pas lancement de produit. L’annonce de Project Glasswing d’Anthropic détaille la structure — douze partenaires fondateurs, environ quarante organisations d’infrastructures critiques supplémentaires, et $100M de crédits d’utilisation.

Ce que fait le modèle, selon Anthropic : identifie les vulnérabilités dans les grandes bases de code, construit des exploits fonctionnels avec moins de guidance manuelle que les modèles précédents, exécute des opérations de sécurité à long horizon. Le rapport de l’équipe rouge sur Mythos Preview détaille des cas spécifiques, dont une chaîne d’exécution de code à distance entièrement autonome contre une implémentation NFS open-source. Le profil de capacité est la raison du contrôle d’accès, pas une ligne de marketing.

Pourquoi Mythos n’est pas un lancement de modèle public ordinaire

La plupart des discussions en ligne traitent la préversion comme le grand frère d’Opus. Ce n’est pas le cas.

Le niveau de capacité est plus élevé — les propres chiffres d’alignement d’Anthropic placent Opus 4.8 comme “similaire à Mythos Preview” sur les métriques de désalignement, ce qui vous indique que la préversion était le point de référence — mais la distribution est l’histoire principale. Anthropic a choisi de le déployer étroitement auprès de partenaires vérifiés plutôt que largement à un prix premium. Un choix délibéré concernant une capacité frontière aux usages à la fois offensifs et défensifs. Une catégorie différente de “on fait payer plus pour le modèle intelligent.”

Anthropic a indiqué que les modèles de classe Mythos atteindront des clients plus larges “dans les prochaines semaines” avec des garde-fous supplémentaires. Veuillez vous référer à la documentation officielle la plus récente d’Anthropic pour la fenêtre de déploiement réelle — “prochaines semaines” est le genre de formule qui évolue.

Pourquoi les développeurs ne devraient pas confondre Opus 4.8 et Mythos

Disponibilité en production vs confinement de préversion

C’est là que je vois les équipes trébucher.

Si vous définissez une feuille de route, la réponse est presque toujours Opus 4.8. SLA standard, tarification, support. Le modèle sur lequel vous construisez un produit.

Une préversion de recherche, ce n’est pas ça. Les préversions peuvent changer, être retirées, modifier leur tarification ou voir leur accès révoqué. Elles n’offrent pas les mêmes garanties de production. Même si votre organisation intégrait Glasswing demain, la bonne façon d’y penser est comme un outil pour une charge de travail défensive spécifique — pas comme un substitut pour un produit orienté client.

Je me suis arrêtée là quand l’une de ces deux personnes continuait à insister. “Mais si c’est meilleur en raisonnement, pourquoi ne pas l’utiliser pour notre charge de travail agentique ?” La réponse honnête : “meilleur en raisonnement” et “adapté à votre produit” sont deux phrases différentes. La première concerne la capacité. La seconde concerne l’adéquation. Elles se recoupent moins que le langage marketing ne le suggère.

Planification API, routage de modèles et risque fournisseur

Si vous concevez pour les 6 à 12 prochains mois, voici ce que je mettrais dans le document de planification :

Construisez sur Opus 4.8 aujourd’hui. Le coût de migration depuis la 4.7 est quasi nul — même famille d’identifiants de modèle, même tarification, même fenêtre contextuelle, surface API additive.
Planifiez pour un modèle GA de classe Mythos. Anthropic a signalé son arrivée. Concevez votre abstraction pour que l’intégration d’un flagship de niveau supérieur soit un changement de configuration, pas un refactoring.
Ne pariez pas une feuille de route sur un accès en préversion. Même si vous êtes éligibles à Glasswing, ne faites pas d’une fonctionnalité exclusive à la préversion votre différenciateur. Le plancher peut bouger.
Surveillez les métriques d’alignement, pas seulement celles de capacité. L’amélioration d’alignement rapportée sur Opus 4.8 — plus proche de Mythos que de la 4.7 — compte davantage en production qu’un point supplémentaire sur un benchmark de codage.

Pour les équipes qui font déjà du routage multi-modèles, c’est un non-événement. Vous ajoutez claude-opus-4-8 à côté de tout ce que vous routez déjà, vous faites un A/B test sur des charges de travail réelles, vous décidez selon vos évaluations. Les plateformes d’agrégation comme WaveSpeedAI se situent dans cette voie — un endpoint, on change la chaîne du modèle, on compare. Ennuyeux, correct. Pas “attendre Mythos.”

Ce qu’il faut surveiller ensuite

Quelques éléments que je suis. Pas des prédictions — juste ce qui mérite d’être vérifié :

La fenêtre de déploiement GA de classe Mythos. “Prochaines semaines.” Si ça glisse, la raison compte plus que la date.
L’écart honnêteté / désalignement. Anthropic a publié un graphique montrant Opus 4.8 et Mythos pratiquement à égalité à ~1,9 sur le désalignement interne. Si cela se maintient dans des évaluations indépendantes, la valeur de l’accès en préversion diminue.
Les workflows dynamiques dans de vraies bases de code. Une préversion de recherche qui soit atterrit fort, soit disparaît. Je le saurai après l’avoir exécutée sur une vraie migration.

C’est là que mes données s’arrêtent. Suite la semaine prochaine.

FAQ

Qu’est-ce que Claude Mythos Preview ?

Un modèle de recherche frontier d’Anthropic, distribué sous forme de préversion de recherche restreinte dans le cadre de Project Glasswing — une coalition de cybersécurité défensive. L’accès est sur invitation, prioritaire pour les organisations travaillant sur la sécurité des logiciels critiques. Ne fait pas partie du niveau public Haiku/Sonnet/Opus. Veuillez vous référer à la documentation officielle la plus récente d’Anthropic pour le périmètre et les critères d’éligibilité actuels.

En quoi la préversion diffère-t-elle de Claude Opus 4.8 ?

Deux catégories. Anthropic Opus 4.8 est le flagship en disponibilité générale — toute personne disposant d’une clé API Claude peut l’utiliser. Mythos est un modèle de recherche restreint avec un cadre de sécurité défensive, distribué uniquement à des partenaires vérifiés. Anthropic le positionne au-dessus d’Opus 4.8 sur son échelle de capacité interne, mais la différence la plus importante est la distribution : l’un est déployé à tous, l’autre de façon restreinte.

Les développeurs peuvent-ils accéder à Claude Mythos via l’API ?

Pas par des canaux en libre-service. Pas d’inscription, pas de liste d’attente qui se convertit en accès standard, pas d’entrée sur la page de tarification pour les clients généraux. L’identifiant du modèle existe sur l’API Claude, Bedrock, Vertex AI et Foundry, mais le contrôle est au niveau de l’accès. Les équipes de sécurité qualifiées peuvent faire une demande via le programme de vérification cyber d’Anthropic — chemin d’entrée possible, pas une voie garantie. Veuillez vous référer à la documentation officielle la plus récente d’Anthropic pour les critères actuels.

Pourquoi la préversion est-elle restreinte ?

La raison déclarée d’Anthropic : les capacités de cybersécurité du modèle — y compris le développement autonome d’exploits — créent un profil de risque différent d’une version frontier typique. Le contrôle d’accès permet à Anthropic et à ses partenaires de développer des garde-fous avant un déploiement plus large. Ce n’est pas une histoire de “trop dangereux pour être publié” ; c’est une décision de contrôle d’accès concernant une capacité aux usages à la fois offensifs et défensifs. Veuillez vous référer aux dernières divulgations d’Anthropic pour la posture de sécurité actuelle.

”opus 4.8 max” est-il un modèle distinct ?

Non. Opus 4.8 max n’est pas un modèle différent — c’est le réglage le plus élevé du curseur d’effort. L’échelle complète : faible → moyen → élevé (par défaut) → très élevé → maximum. Les réglages plus élevés permettent au modèle de réfléchir plus longtemps pour une meilleure qualité. Si vous cherchiez un niveau distinct, vous cherchiez probablement l’effort maximum, pas un SKU séparé.

Les développeurs devraient-ils planifier autour d’Opus 4.8 ou attendre Mythos ?

Construisez sur Opus 4.8 aujourd’hui. Anthropic a indiqué que les capacités de classe Mythos atteindront des clients plus larges “dans les prochaines semaines”, mais une feuille de route n’est pas une version. Concevez votre stack pour qu’un flagship de niveau supérieur soit un simple changement de configuration lorsqu’il arrive. Ne bloquez pas un produit sur un accès en préversion.

Conclusion

Deux produits. Deux catégories. Ne les confondez pas dans votre plan de migration.

Anthropic Opus 4.8 est le modèle sur lequel vous déployez ce trimestre — disponibilité générale, même tarification que la 4.7, modifications API additives, améliorations réelles en codage et en honnêteté. Claude Mythos est une préversion de recherche restreinte pour la cybersécurité défensive, avec un chemin vers une disponibilité plus large qu’Anthropic a signalé mais sans engagement de date. Construisez pour le niveau publié, concevez pour que le niveau préversion arrive plus tard, et tout va bien. Pariez une feuille de route sur un accès en préversion et ce ne sera pas le cas.

C’est tout. Testez-le sur votre propre charge de travail. Ça vous en apprendra plus que moi.

Articles précédents :