← Blog

Claude Opus 4.8 vs Claude Mythos: Veröffentlicht vs Vorschau

Vergleich von Claude Opus 4.8 und Claude Mythos Preview: Was ist öffentlich verfügbar, was ist eingeschränkt, und worauf Entwickler achten sollten, bevor sie ihre Einführung planen.

By Dora 10 min read
Claude Opus 4.8 vs Claude Mythos: Veröffentlicht vs Vorschau

Ich bin Dora. Letzte Woche haben mich zwei Personen dieselbe Frage gestellt: „Soll ich unsere Pipeline zu Claude Mythos migrieren oder auf Opus 4.8 warten?” Beide hatten die Fragestellung falsch. Mythos ist kein Modell, das man neben Opus in der API-Konsole auswählen kann. Opus 4.8 ist jetzt das standardmäßig verfügbare Flaggschiff gemäß Anthropics Opus 4.8-Ankündigung; die Vorschau befindet sich hinter einer Einladungsliste. Wenn du als Entwickler eines von beiden für den Produktionseinsatz evaluierst, geht es in diesem Beitrag darum, warum die Unterscheidung wichtig ist, bevor du eine einzige Zeile Routing-Code schreibst.

Keine Spekulation über Vorschau-Leistung, die ich nicht selbst getestet habe.

Claude Opus 4.8 vs Claude Mythos auf einen Blick

Öffentliche Veröffentlichung vs. beschränkte Forschungsvorschau

Zwei verschiedene Kategorien. Das ist der entscheidende Punkt.

Opus 4.8 wurde am 28. Mai 2026 veröffentlicht. Allgemein verfügbar. Standardpreise, Standard-API-ID claude-opus-4-8, normaler Checkout-Prozess. Wer am Donnerstagmorgen noch eine Opus 4.7-Integration hatte, hatte am Donnerstagnachmittag 4.8 — gleicher Endpunkt, gleiche Docs, nur additive Änderungen.

Mythos Preview ist etwas anderes. Anthropic beschreibt es als eine beschränkte Forschungsvorschau, die über Project Glasswing verteilt wird — eine Koalition für defensive Cybersicherheit. Seit April 2026 verfügbar, aber „verfügbar” bedeutet hier: zugänglich für etwa 50 geprüfte Organisationen — AWS, Apple, Google, Microsoft, Cloudflare, CrowdStrike, die Linux Foundation und rund 40 weitere Betreiber kritischer Infrastruktur. Anthropic hat erklärt, dass die Vorschau nicht allgemein zugänglich gemacht werden soll.

Wenn jemand also die beiden vergleicht, vergleicht er nicht zwei Produkte, zwischen denen man wählen kann. Er vergleicht das, was für ihn verfügbar ist, mit dem, was für eine geschlossene Liste verfügbar ist.

Verfügbarkeit für Entwickler und Zugangswege

MerkmalClaude Opus 4.8Claude Mythos Preview
StatusAllgemein verfügbarBeschränkte Forschungsvorschau
ZugangSelf-Serve-API, claude.ai, Claude CodeNur auf Einladung über Project Glasswing
PlattformenClaude API, Bedrock, Vertex AI, FoundryDieselben vier Plattformen, beschränkt
AnwendungsfallAllzweck-FlaggschiffDefensive Cybersicherheitsforschung
ProduktionstauglichJaNein — Vorschau, kein GA

Es gibt keinen Bewerbungspfad im herkömmlichen Sinne. Ein Cyber Verification Program existiert für qualifizierte Sicherheitsteams, aber es ist keine Warteliste, die in einen allgemeinen Zugang umgewandelt wird. Bitte beachte Anthropics aktuelle offizielle Dokumentation für aktuelle Zugangskriterien — diese Richtlinie wird ohne viel Vorwarnung aktualisiert.

Was Anthropic über Opus 4.8 bestätigt hat

API-Verfügbarkeit, Preisstatus und Benchmark-Entwicklung

Die sachlichen Fakten sind klar. Anthropic hat Claude Opus 4.8 zum gleichen Preis wie 4.7 veröffentlicht — 5 $ pro Million Input-Token, 25 $ pro Million Output — über die Claude API, Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry. Das 1-Million-Token-Kontextfenster bleibt erhalten (200K auf Foundry zum Launch). Ich werde nicht jeden Chart aus dem Launch-Post wiederholen; siehe die Claude API-Dokumentation für Opus 4.8. Die Punkte, die das Verhalten von Entwicklern tatsächlich verändert haben:

  • Aufwandsregler sichtbar in claude.ai, nicht nur als API-Parameter. Stufen: niedrig → mittel → hoch (Standard) → xhoch/extra → max. Bei Coding-Aufgaben verbraucht die Standardstufe „hoch” ungefähr die gleiche Anzahl an Token wie 4.7s Standard, liefert aber bessere Ergebnisse.
  • Fast Mode als Forschungsvorschau: ~2,5-fache Ausgabegeschwindigkeit bei 10 $/50 $ pro Million Token.
  • Dynamische Workflows in Claude Code (Forschungsvorschau), die Hunderte paralleler Subagenten orchestrieren.
  • Mittig im Gespräch einfügbare Systemnachrichten in der Messages API — klein, aber nützlich für langlebige Agenten.

Beim Thema Opus 4.8 Benchmarks berichtet Anthropic von SWE-bench Pro mit 69,2 % (gegenüber 64,3 %) und ähnlichen Verbesserungen bei agentischem Coding, multidisziplinärem Denken und wissenschaftlichen Evaluierungen. Ich habe diese nicht mit meiner eigenen Arbeitslast neu berechnet. Die Verbesserung der Ehrlichkeit — Anthropic behauptet, etwa 4-mal weniger wahrscheinlich, Mängel unkommentiert durchgehen zu lassen — ist die, die mich interessiert, denn das ist die Art von Regression, die auf einem Leaderboard nichts kostet, aber im Produktionsbetrieb echtes Geld. Noch zu verifizieren.

Ein Preishinweis, der in der Ankündigung vergraben war: Der Fast Mode ist etwa dreimal günstiger als der Fast Mode bei früheren Modellen. Wer ihn bei 4.7 als zu teuer abgetan hat, sollte die Rechnung neu aufmachen.

Was Anthropic über Claude Mythos Preview bestätigt hat

Project Glasswing, defensiver Sicherheitseinsatz und eingeschränkter Zugang

Die Vorschau wurde am 7. April 2026 zusammen mit Project Glasswing veröffentlicht. Der Rahmen ist spezifisch: defensives Cybersicherheitsprogramm, kein Produktlaunch. Anthropics Project Glasswing-Ankündigung legt die Struktur dar — zwölf Gründungspartner, rund vierzig weitere Organisationen kritischer Infrastruktur und 100 Millionen Dollar an Nutzungsguthaben.

Was das Modell laut Anthropic tut: Schwachstellen in großen Codebasen identifizieren, funktionierende Exploits mit weniger manueller Anleitung als frühere Modelle entwickeln, langfristige Sicherheitsoperationen durchführen. Der Mythos Preview Red-Team-Bericht behandelt spezifische Fälle, darunter eine vollständig autonome Remote-Code-Execution-Kette gegen eine Open-Source-NFS-Implementierung. Das Fähigkeitsprofil ist der Grund für die Beschränkung — kein Marketing-Slogan.

Warum Mythos kein normaler öffentlicher Modell-Launch ist

Der Großteil des Online-Diskurses behandelt die Vorschau wie den größeren Bruder von Opus. Das ist sie nicht.

Das Fähigkeitsniveau ist höher — Anthropics eigene Alignment-Zahlen stufen Opus 4.8 als „ähnlich wie Mythos Preview” in Bezug auf Fehlausrichtungs-Metriken ein, was zeigt, dass die Vorschau der Referenzpunkt war — aber die Verteilung ist die eigentliche Geschichte. Anthropic hat sich entschieden, es eng an geprüfte Partner zu verteilen, statt breit zu Premium-Preisen. Eine bewusste Entscheidung über eine Frontier-Fähigkeit mit sowohl offensiven als auch defensiven Anwendungen. Eine andere Kategorie als „wir verlangen mehr für das schlaue Modell.”

Anthropic hat erklärt, dass Modelle der Mythos-Klasse „in den kommenden Wochen” breiteren Kunden mit zusätzlichen Schutzmaßnahmen zugänglich gemacht werden. Bitte beachte Anthropics aktuelle offizielle Dokumentation für das tatsächliche Rollout-Fenster — „kommende Wochen” ist die Art von Formulierung, die sich verschiebt.

Warum Entwickler Opus 4.8 und Mythos nicht verwechseln sollten

Produktionsreife vs. Preview-Einschränkung

Hier sehe ich, wo Teams stolpern.

Wenn du einen Fahrplan erstellst, lautet die Antwort fast immer Opus 4.8. Standard-SLAs, Preise, Support. Das Modell, auf dem du ein Produkt aufbaust.

Eine Forschungsvorschau ist das nicht. Vorschauen können sich ändern, zurückgezogen werden, die Preisgestaltung verschieben oder der Zugang kann widerrufen werden. Sie bieten nicht die gleichen Produktionsgarantien. Selbst wenn deine Organisation morgen in Glasswing aufgenommen würde, ist der richtige Ansatz, es als Werkzeug für eine spezifische defensive Arbeitslast zu betrachten — nicht als Drop-in für ein kundenorientiertes Produkt.

Ich habe hier innegehalten, als eine der beiden Personen immer weiter nachgehakt hat. „Aber wenn es bei der Argumentation besser ist, warum sollte ich es nicht für unsere agentische Arbeitslast verwenden?” Die ehrliche Antwort: „Besser beim Schlussfolgern” und „geeignet für dein Produkt” sind unterschiedliche Sätze. Ersteres ist Fähigkeit. Letzteres ist Eignung. Sie überschneiden sich weniger, als die Marketing-Sprache vermuten lässt.

API-Planung, Modell-Routing und Anbieterrisiko

Wenn du für die nächsten 6–12 Monate planst, würde ich Folgendes in das Planungsdokument aufnehmen:

  • Heute auf Opus 4.8 aufbauen. Die Migrationskosten von 4.7 sind nahezu null — gleiche Modell-ID-Familie, gleiche Preise, gleiches Kontextfenster, additive API-Oberfläche.
  • Für ein GA-Modell der Mythos-Klasse planen. Anthropic hat signalisiert, dass es kommt. Gestalte deine Abstraktion so, dass der Austausch gegen ein höherrangiges Flaggschiff eine Konfigurationsänderung ist, kein Refactoring.
  • Keinen Fahrplan auf Preview-Zugang setzen. Selbst wenn du dich für Glasswing qualifizierst, mach kein Alleinstellungsmerkmal aus einem Preview-only-Feature. Der Boden kann sich verschieben.
  • Alignment-Metriken beachten, nicht nur Fähigkeits-Metriken. Die gemeldete Alignment-Verbesserung bei Opus 4.8 — näher an Mythos als an 4.7 — ist im Produktionsbetrieb wichtiger als ein weiterer Punkt auf einem Coding-Benchmark.

Für Teams, die bereits Multi-Modell-Routing betreiben, ist das ein Non-Event. Du fügst claude-opus-4-8 neben allem anderen, zu dem du routest, hinzu, testest es A/B mit echten Workloads und entscheidest anhand deiner eigenen Evaluierungen. Aggregationsplattformen wie WaveSpeedAI bedienen diese Nische — ein Endpunkt, den Modell-String austauschen, vergleichen. Langweilig, korrekt. Nicht „auf Mythos warten.”

Was als Nächstes zu beobachten ist

Ein paar Dinge, die ich verfolge. Keine Vorhersagen — nur das, was es wert ist, im Auge zu behalten:

  • Das GA-Rollout-Fenster der Mythos-Klasse. „Kommende Wochen.” Wenn sich das verschiebt, ist der Grund wichtiger als das Datum.
  • Die Lücke bei Ehrlichkeit / Fehlausrichtung. Anthropic hat ein Diagramm veröffentlicht, das zeigt, dass Opus 4.8 und Mythos intern bei ~1,9 Fehlausrichtung praktisch gleichauf liegen. Wenn das bei unabhängigen Evaluierungen hält, sinkt der Wert des Preview-Zugangs.
  • Dynamische Workflows in echten Codebasen. Eine Forschungsvorschau, die entweder einschlägt oder verschwindet. Ich weiß es nach dem Test mit einer echten Migration.

Hier endet meine Datenlage. Fortsetzung nächste Woche.

FAQ

Was ist Claude Mythos Preview?

Ein Frontier-Forschungsmodell von Anthropic, das im Rahmen einer beschränkten Forschungsvorschau als Teil von Project Glasswing verteilt wird — einer Koalition für defensive Cybersicherheit. Der Zugang erfolgt nur auf Einladung, priorisiert für Organisationen, die an kritischer Software-Sicherheit arbeiten. Kein Teil der öffentlichen Haiku/Sonnet/Opus-Stufe. Bitte beachte Anthropics aktuelle offizielle Dokumentation für aktuellen Umfang und Zugangsberechtigung.

Wie unterscheidet sich die Vorschau von Claude Opus 4.8?

Zwei Kategorien. Anthropic Opus 4.8 ist das allgemein verfügbare Flaggschiff — jeder mit einem Claude-API-Schlüssel kann es nutzen. Mythos ist ein beschränktes Forschungsmodell mit einem defensiv-sicherheitsorientierten Rahmen, das nur an geprüfte Partner verteilt wird. Anthropic positioniert es auf seiner internen Fähigkeitsleiter über Opus 4.8, aber der wichtigere Unterschied ist die Verteilung: eines wird an alle ausgeliefert, das andere eng begrenzt.

Können Entwickler über die API auf Claude Mythos zugreifen?

Nicht über Self-Serve-Kanäle. Keine Registrierung, keine Warteliste, die in Standardzugang umgewandelt wird, kein Preisseiteneintrag für Allgemeinkunden. Der Modellbezeichner existiert auf Claude API, Bedrock, Vertex AI und Foundry, aber die Zugangsbeschränkung liegt auf der Zugriffsebene. Qualifizierte Sicherheitsteams können sich über Anthropics Cyber Verification Program bewerben — ein möglicher Aufnahmeweg, keine garantierte Route. Bitte beachte Anthropics aktuelle offizielle Dokumentation für aktuelle Kriterien.

Warum ist die Vorschau beschränkt?

Anthropics genannter Grund: Die Cybersicherheitsfähigkeiten des Modells — einschließlich autonomer Exploit-Entwicklung — schaffen ein anderes Risikoprofil als eine typische Frontier-Veröffentlichung. Die Beschränkung erlaubt es Anthropic und Partnern, Schutzmaßnahmen vor einer breiteren Bereitstellung zu entwickeln. Keine „zu gefährlich zum Veröffentlichen”-Geschichte; eine Zugangskontroll-Entscheidung über eine Fähigkeit mit sowohl offensiven als auch defensiven Anwendungen. Bitte beachte Anthropics aktuelle Offenlegungen für die aktuelle Sicherheitslage.

Ist „opus 4.8 max” ein separates Modell?

Nein. Opus 4.8 max ist kein anderes Modell — es ist die höchste Einstellung auf dem Aufwandsregler. Die vollständige Leiter: niedrig → mittel → hoch (Standard) → xhoch/extra → max. Höhere Einstellungen erlauben dem Modell, länger nachzudenken, um bessere Qualität zu erzielen. Wenn du mit einer separaten Stufe gesucht hast, suchtest du wahrscheinlich nach maximaler Bemühung, nicht nach einer separaten SKU.

Sollten Entwickler auf Opus 4.8 planen oder auf Mythos warten?

Heute auf Opus 4.8 aufbauen. Anthropic hat erklärt, dass Fähigkeiten der Mythos-Klasse „in den kommenden Wochen” breiteren Kunden zugänglich gemacht werden, aber ein Fahrplan ist keine Veröffentlichung. Gestalte deinen Stack so, dass ein höherrangiges Flaggschiff ein Konfigurationswechsel ist, wenn es ankommt. Blockiere kein Produkt durch Preview-Zugang.

Fazit

Zwei Produkte. Zwei Kategorien. Verwechsle sie nicht in deinem Migrationsplan.

Anthropic Opus 4.8 ist das Modell, auf dem du dieses Quartal auslieferst — allgemein verfügbar, gleiche Preise wie 4.7, additive API-Änderungen, echte Verbesserungen bei Coding und Ehrlichkeit. Claude Mythos ist eine beschränkte Forschungsvorschau für defensive Cybersicherheit mit einem Weg zu breiterer Verfügbarkeit, den Anthropic signalisiert, aber für den kein Datum zugesagt wurde. Baue für die veröffentlichte Stufe, plane dafür, dass die Vorschau-Stufe später verfügbar wird, und du bist auf der sicheren Seite. Setze einen Fahrplan auf Preview-Zugang und du nicht.

Das war’s. Teste es mit deiner eigenen Arbeitslast. Das sagt dir mehr als ich kann.

Vorherige Beiträge: