Claude Managed Agents Schnellstartanleitung 2026
Schritt-für-Schritt-Schnellstart für Claude Managed Agents: Beta-Header-Einrichtung, erste Sitzung, Tool-Aufrufe und Streaming-Events — mit wichtigen Code-Mustern und Kostenkontrollpunkten.
Als ich zum ersten Mal versuchte, eine Managed Agents-Sitzung auszuführen, bekam ich beim allerersten curl-Befehl einen 400-Fehler. Nicht bei der Agent-Erstellung. Nicht bei der Umgebung. Beim Stream-Endpunkt. Ich hatte meinen Header aus der Create-Anfrage kopiert — anthropic-beta: managed-agents-2026-04-01 — und die Streaming-API hat ihn abgelehnt. Es stellte sich heraus, dass der Streaming-Endpunkt zu diesem Zeitpunkt in der Dokumentation einen anderen Beta-Header referenzierte. Ich habe vierzig Minuten damit verschwendet.
Wenn du heute versuchen möchtest, deine erste Managed Agents-Sitzung von Anfang bis Ende zum Laufen zu bringen, ist dies der Weg, den ich tatsächlich gegangen bin. Hey, hier ist Dora! Beta-Header zuerst, denn dort liegen die Hälfte aller Fehler. Dann Agent, Umgebung, Sitzung, Stream. Und am Ende ein Kosten-Checkpoint, weil die Sitzungslaufzeit weiterläuft, während du debuggst.

Bevor du anfängst
Du benötigst einen Anthropic-API-Schlüssel mit Managed Agents-Zugang. Es gibt derzeit keine Warteliste — jeder vorhandene Schlüssel funktioniert in der öffentlichen Beta.
Der Beta-Header ist nicht verhandelbar. Jeder Managed Agents-Endpunkt erfordert anthropic-beta: managed-agents-2026-04-01. Laut der Managed Agents-Übersicht von Anthropic setzt das SDK diesen Header automatisch. Wenn du rohe curl-Befehle verwendest, musst du ihn jeder Anfrage selbst hinzufügen. Das ist die häufigste Ursache für 400-Fehler, die ich in Community-Berichten gesehen habe.
Wenn du das offizielle SDK verwendest (anthropic für Python, @anthropic-ai/sdk für TypeScript), stelle sicher, dass du eine Version verwendest, die Beta-Agent-Support enthält. Ältere Versionen haben kein client.beta.agents oder client.beta.sessions.
Die Modellwahl spielt hier eine Rolle. Opus 4.7 ist klüger bei langfristigem agentenbasiertem Reasoning. Sonnet 4.6 ist günstiger und schneller pro Token. Für einen Quickstart-Durchlauf reicht Sonnet 4.6. Wenn deine echte Arbeitslast Debugging, Planung oder lange Tool-Ketten umfasst, rechtfertigt Opus 4.7 seinen Preis.
Schritt 1 — Agent definieren

Ein Agent ist in Managed Agents ein Konfigurationsobjekt, kein Prozess. Du definierst Name, Modell, System-Prompt und Tool-Zugriff einmal und verwendest ihn dann über mehrere Sitzungen hinweg wieder.
Minimal-Definition aus dem offiziellen Quickstart:
python
agent = client.beta.agents.create(
name="Coding Assistant",
model="claude-opus-4-7",
system="You are a helpful coding agent.",
tools=[{"type": "agent_toolset_20260401"}],
)
Der Tool-Typ agent_toolset_20260401 schaltet das vollständige eingebaute Toolset frei — bash, Datei lesen/schreiben, Websuche, Web-Fetch, Code-Ausführung. Du kannst es später einschränken. Für einen ersten Durchlauf lass es weit gefasst, damit du sehen kannst, was der Agent tatsächlich zu verwenden wählt.
Speichere agent.id. Jede Sitzung referenziert darauf.
Schritt 2 — Umgebung erstellen

Eine Umgebung definiert den Sandbox-Container. Für die meisten ersten Durchläufe:
python
env = client.beta.environments.create(
name="quickstart-env",
config={"type": "cloud", "networking": {"type": "unrestricted"}},
)
Speichere env.id. Wenn dein Agent nur sein eigenes Dateisystem berührt, ist "networking": {"type": "limited"} sicherer und gut dokumentiert im SRE Incident Responder Cookbook.
Schritt 3 — Sitzung starten
Eine Sitzung verbindet einen Agent mit einer Umgebung. Das Erstellen einer Sitzung startet keine Arbeit. Es provisioniert lediglich. Die Arbeit beginnt, wenn du ein User-Event sendest.
python
session = client.beta.sessions.create(
agent=agent.id,
environment_id=env.id,
title="Quickstart session",
)
Dieses Muster — erstellen, dann mit Events steuern — ist der Punkt, an dem das Zustandsmaschinen-Modell aus der Sessions-Referenz Sinn ergibt. Die Sitzung bleibt bestehen. Du kannst später weitere Events senden. Das Dateisystem überlebt zwischen den Durchläufen.
Schritt 4 — Events streamen

Öffne den Stream, sende die User-Nachricht, lies Events bis session.status_idle:
python
with client.beta.sessions.events.stream(session.id) as stream:
client.beta.sessions.events.send(
session.id,
events=[{
"type": "user.message",
"content": [{"type": "text",
"text": "Generate first 20 Fibonacci numbers, save to fib.txt"}],
}],
)
for event in stream:
match event.type:
case "agent.message":
for block in event.content:
print(block.text, end="")
case "agent.tool_use":
print(f"\n[tool: {event.name}]")
case "session.status_idle":
break
Event-Namen folgen dem Muster {domain}.{action}. Das vollständige Schema befindet sich in der Dokumentation zu Events und Streaming. Das Feld processed_at ist wichtig: Wenn es null ist, ist das Event in der Warteschlange und noch nicht ausgeführt. Das habe ich bei meinem ersten Durchlauf übersehen und dachte, Tools würden lautlos fehlschlagen.
Kosten-Checkpoints
Managed Agents berechnet zwei Dinge: Standard-Token-Tarife plus $0,08 pro Sitzungsstunde aktiver Laufzeit. Laut der offiziellen Preisseite wird die Laufzeit millisekunden-genau berechnet — aber nur, wenn der Status running ist. Leerlaufzeit und beendete Sitzungen werden nicht berechnet.
Was das in der Praxis bedeutet:
- Eine Sitzung, die du beim Debuggen vergisst zu schließen: läuft weiter auf (wenn sie aktiv ist).
- Websuche: $10 pro 1.000 Aufrufe, separat abgerechnet. Research-Agenten erreichen das schnell.
- Überprüfe aktive Sitzungen in der Console-Ablaufverfolgung, bevor du für den Tag aufhörst. Überprüfe den aktuellen UI-Pfad selbst — das Console-Layout wird laufend weiterentwickelt.
Häufige Fehler
Fehlender oder falscher Beta-Header. 400-Fehler, oft mit einer Meldung über nicht unterstützte Endpunkte. Lösung: Bestätige managed-agents-2026-04-01 bei jedem direkten HTTP-Aufruf. Wenn du das SDK verwendest und diesen Fehler trotzdem erhältst, aktualisiere das SDK.
Rate Limits. Create-Endpunkte sind auf 60 rpm begrenzt; Read-Endpunkte auf 600 rpm. Organisations-Tier-Limits gelten zusätzlich. 429-Fehler bedeuten: mit Jitter zurückziehen, nicht sofort erneut versuchen.
Stiller Tool-Loop. Der Agent ruft weiterhin Tools auf, aber erzeugt keine abschließende Nachricht. Überprüfe Sitzungs-Traces — meist ein unbehandeltes requires_action, auf das nie eine Antwort zurückgesendet wurde.
FAQ
F1: Wie aktiviere ich die Multi-Agent-Koordination in Managed Agents?
Multi-Agent (zusammen mit Memory und Outcomes) ist noch eine Research-Preview-Funktion. Du beantragst den Zugang separat über die Claude Console. Das Koordinationsmuster — Orchestrator delegiert an aufrufbare Agents — ist unter Multiagent-Sitzungen dokumentiert, aber du kannst es erst verwenden, wenn das Preview-Flag für deine Organisation aktiviert ist.
F2: Kann ich einsehen, welche Tools der Agent während einer Sitzung aufgerufen hat?
Ja. Verwende client.beta.sessions.events.list(session.id) für programmatischen Zugriff oder die Trace-Ansicht der Console für eine chronologische Zeitleiste mit Tokens und Zeitstempeln pro Event.
F3: Wo ist das offizielle Managed Agents Cookbook?
Die Tutorials befinden sich auf der Claude Cookbook-Website — das Notebook iterate-fix-failing-tests ist die beste erste Lektüre. Das operate-in-production-Notebook behandelt Vaults, MCP und Webhooks, sobald du über die Hello-World-Phase hinaus bist.
F4: Gibt es eine Möglichkeit, zu testen, ohne Sitzungslaufzeitkosten zu verursachen?
Es gibt keinen dedizierten kostenlosen Tarif für Managed Agents. Standard-API-Gratiskredit deckt es ab. Halte Sitzungen während der Entwicklung kurz und schließe sie, wenn du aufhörst zu arbeiten. Inaktive Sitzungen werden nicht berechnet, aber laufende schon — und “laufend” schließt lautlos in Schleifen laufende Agents ein.
F5: Was ist das beste Modell für lang laufende Managed Agents-Aufgaben?
Es hängt davon ab, was “lang laufend” bedeutet. Für mehrstündiges Reasoning mit intensiver Tool-Nutzung: Opus 4.7. Für hochvolumige, einfachere Schleifen reduziert Sonnet 4.6 mit Prompt-Caching die Kosten erheblich. Ich teste Opus 4.7 noch bei Sitzungen von über 2 Stunden. Das ist der Punkt, an dem meine Daten enden. Mehr folgt.
Ich überprüfe noch, wie sich die Komprimierung nach der Zwei-Stunden-Marke verhält. Führe es selbst durch — das wird dir mehr sagen, als ich kann.
Vorherige Beiträge:


