← Blog

Claude Opus 4.6 und Sonnet 4.6: Alles, was Sie wissen müssen

Ein tiefer Einblick in Anthropics Claude Opus 4.6 und Sonnet 4.6 – die bisher leistungsfähigsten Claude-Modelle mit 1-Million-Token-Kontextfenstern, adaptivem Denken und erstklassigen Benchmarks.

5 min read

Anthropic hat die Messlatte erneut höher gelegt. Mit der Veröffentlichung von Claude Opus 4.6 (5. Februar 2026) und Claude Sonnet 4.6 (17. Februar 2026) liefert die Claude-Modellfamilie bedeutende Fortschritte beim Programmieren, agentischen Workflows, Long-Context-Reasoning und Computer Use – bei unveränderter Preisgestaltung gegenüber der Vorgängergeneration.

Hier ist, was die 4.6-Generation zu einem bedeutenden Sprung nach vorne macht.

Claude Opus 4.6: Das leistungsfähigste Claude aller Zeiten

Opus 4.6 ist Anthropics Flaggschiff-Modell, das für die anspruchsvollsten Aufgaben in den Bereichen Programmierung, Forschung und komplexes Reasoning entwickelt wurde.

1M-Kontextfenster zum Standardpreis

Zum ersten Mal wird ein Opus-Modell mit einem Kontextfenster von 1 Million Tokens ausgeliefert – ohne Aufpreise für lange Kontexte. Das bedeutet, Sie können ganze Codebasen, umfangreiche Rechtsdokumente oder massive Datensätze in einem einzigen Prompt verarbeiten, ohne sich über zusätzliche Kosten Gedanken machen zu müssen.

128K Ausgabe-Tokens

Opus 4.6 verdoppelt die maximale Ausgabe von 64K auf 128K Tokens, was die Generierung von Langform-Inhalten, detailliertem Code oder umfassenden Analysen in einer einzigen Antwort deutlich praktikabler macht.

Adaptives Denken

Die Zeiten des manuellen Feinabstimmens von Extended-Thinking-Budgets sind vorbei. Opus 4.6 führt adaptives Denken ein, bei dem Claude dynamisch entscheidet, wann und wie tief es denkt. Sie können einen von vier Aufwandsgraden festlegen – niedrig, mittel, hoch (Standard) oder maximal – und das Modell sein Reasoning-Budget entsprechend verteilen lassen.

Verschachteltes Denken

In agentischen Workflows kann Claude jetzt zwischen Tool-Aufrufen denken. Anstatt alles im Voraus zu planen und dann auszuführen, denkt das Modell bei jedem Schritt nach und passt seinen Ansatz basierend auf Zwischenergebnissen an. Dies macht mehrstufige Aufgaben deutlich zuverlässiger.

Kontext-Komprimierung

Wenn Gespräche das Kontextlimit annähern, fasst Opus 4.6 automatisch ältere Kontextinhalte zusammen und ersetzt sie, anstatt sie einfach abzuschneiden. Dies ermöglicht länger anhaltende Interaktionen – besonders wertvoll für Programmiersitzungen, Debugging und Forschungsworkflows, die sich über viele Gesprächsrunden erstrecken.

Claude Sonnet 4.6: Die Lücke schließt sich

Sonnet 4.6 ist jetzt das Standardmodell für Free- und Pro-Nutzer auf claude.ai. Bemerkenswert an diesem Release ist, wie nah Sonnet an die Opus-Leistung herankommt – der Abstand zwischen beiden ist so gering wie nie zuvor.

Sonnet 4.6 teilt dieselben Kernverbesserungen: 1M-Kontextfenster, adaptives Denken, Extended Thinking und verschachteltes Denken. Alles zu einem deutlich niedrigeren Preis.

Benchmark-Highlights

Die Zahlen sprechen eine überzeugende Sprache:

BenchmarkOpus 4.6Sonnet 4.6
SWE-bench Verified (echte GitHub-Issues)~80,8 %79,6 %
OSWorld-Verified (Computer Use)72,7 %72,5 %
Terminal-Bench 2.0 (agentisches Programmieren)#1 gesamt59,1 %
Humanity’s Last Exam#1 gesamt
ARC-AGI-258,3 % (4,3-facher Gewinn)
BigLaw Bench (juristisches Reasoning)90,2 %
MRCR v2 8-needle @ 1M (Long-Context)76 %

Einige besonders bemerkenswerte Ergebnisse:

  • SWE-bench Verified: Sonnet 4.6 erzielt 79,6 % und kommt damit fast an Opus mit 80,8 % heran. Bei den meisten Programmieraufgaben ist der Unterschied vernachlässigbar.
  • OSWorld: Beide Modelle erzielen über 72 % bei autonomem Computer Use – ein massiver Sprung gegenüber der Vorgängergeneration und weit vor konkurrierenden Modellen.
  • ARC-AGI-2: Sonnet 4.6 sprang von 13,6 % auf 58,3 %, eine 4,3-fache Verbesserung – der größte Generationssprung in der Claude-Geschichte.
  • Long-Context-Retrieval: Opus 4.6 erzielt 76 % beim 8-Nadel-Retrieval-Task bei 1M Kontext, verglichen mit nur 18,5 % für Sonnet 4.5. Eine 4-fache Verbesserung beim Auffinden von Informationen, die tief in langen Dokumenten vergraben sind.

Preisgestaltung

Beide Modelle behalten dieselbe Preisgestaltung wie ihre 4.5-Vorgänger bei:

ModellEingabe (pro 1M Tokens)Ausgabe (pro 1M Tokens)
Opus 4.65 $25 $
Sonnet 4.63 $15 $
Haiku 4.51 $5 $

Das 1M-Kontextfenster ist für Opus und Sonnet zum Standardpreis enthalten – keine Premium-Stufen oder Aufpreise.

Wann welches Modell verwenden

Wählen Sie Opus 4.6, wenn Sie Folgendes benötigen:

  • Maximale Genauigkeit bei komplexem, mehrstufigem Reasoning
  • Long-Context-Aufgaben, die präzises Retrieval über massive Dokumente erfordern
  • Agentische Programmier-Workflows, bei denen Zuverlässigkeit an erster Stelle steht
  • Juristische, wissenschaftliche oder finanzielle Analysen, die höchste Genauigkeit erfordern

Wählen Sie Sonnet 4.6, wenn Sie Folgendes benötigen:

  • Starkes Programmieren und Reasoning zu niedrigeren Kosten
  • Computer Use und agentische Aufgaben (Leistung ist nahezu identisch mit Opus)
  • Eine ausgewogene Balance zwischen Leistungsfähigkeit und Geschwindigkeit
  • Hochvolumige Workloads, bei denen die 40 % Kosteneinsparung sich summiert

Wählen Sie Haiku 4.5, wenn Sie Folgendes benötigen:

  • Schnelle, leichtgewichtige Aufgaben wie Klassifizierung, Zusammenfassung oder einfache Q&A
  • Kostenempfindliche Anwendungen im großen Maßstab

Was das für Entwickler bedeutet

Die 4.6-Generation stellt einen Wandel darin dar, wie Entwickler mit Claude bauen können:

  1. Agentische Workflows sind jetzt praktikabel. Verschachteltes Denken und verbessertes Tool-Use bedeuten, dass Claude komplexe, mehrstufige Aufgaben mit deutlich weniger Fehlern bewältigen kann. Terminal-Bench- und OSWorld-Ergebnisse bestätigen dies.

  2. Kontext ist kein Engpass mehr. Mit 1M Tokens zum Standardpreis und automatischer Kontext-Komprimierung können Sie Anwendungen bauen, die über ganze Repositories, Dokumentensammlungen oder Gesprächshistorien nachdenken.

  3. Die Value-Tier ist außergewöhnlich stark. Sonnet 4.6 liegt bei den meisten Programmier- und Computer-Use-Benchmarks innerhalb von 1–2 % von Opus. Für viele Produktions-Workloads ist es die kluge Standardwahl.

  4. Adaptives Denken vereinfacht die Integration. Anstatt Thinking-Budgets pro Aufgabe zu optimieren, legen Sie einen Aufwandsgrad fest und lassen das Modell den Rest erledigen. Dies reduziert den Prompt-Engineering-Aufwand und macht die Leistung konsistenter.

Das Fazit

Claude Opus 4.6 und Sonnet 4.6 liefern den größten Leistungssprung in einer einzelnen Claude-Generation. Das 1M-Kontextfenster, adaptives Denken und verschachteltes Reasoning sind nicht nur Datenblatt-Verbesserungen – sie verändern grundlegend, was Sie bauen können.

Opus 4.6 setzt neue Benchmarks in allen Bereichen. Sonnet 4.6 kommt bemerkenswert nah heran – bei 60 % des Preises. Und mit Haiku 4.5, das weiterhin für leichtgewichtige Aufgaben verfügbar ist, deckt das vollständige Claude-Lineup jeden Anwendungsfall von Budget bis Frontier ab.

Die Modelle sind jetzt über die Claude API, claude.ai und Partnerplattformen wie Amazon Bedrock und Google Cloud Vertex AI verfügbar.