← Blog

claw-code vs Claude Code: Was ist wirklich anders?

claw-code ist eine Python-Neufassung des Claude Code-Frameworks. Diese Analyse zeigt, was gleich geblieben ist, was fehlt und wann welches Tool für Entwickler sinnvoll ist.

7 min read
claw-code vs Claude Code: Was ist wirklich anders?

Als ich am ersten April aufwachte, erwartete ich die üblichen Memes zu scrollen. Stattdessen brannte mein Feed — Anthropic hatte versehentlich den vollständigen Quellcode von Claude Code in einem npm-Paket veröffentlicht, und ein Entwickler in Korea hatte die Kernarchitektur bereits von Grund auf neu aufgebaut und auf GitHub gepusht. Bis ich mir Kaffee machte, hatte das Repo 30.000 Sterne überschritten.

Dieses Repo ist claw-code. Und wenn du verstehen möchtest, ob es tatsächlich nutzbar, produktionssicher oder nur ein interessantes Artefakt einer chaotischen Nacht ist — diese Analyse ist für dich.

Kurzpositionierung beider Tools

Claude Code ist Anthropics offizieller, terminal-nativer Coding-Agent. Er läuft in deiner CLI oder IDE, versteht deine gesamte Codebasis, übernimmt Git-Operationen, führt Tests aus und wird von Anthropics Infrastruktur- und Sicherheitsteam unterstützt. Er erfordert ein Claude Pro- oder Max-Abonnement (~$20/Monat).

claw-code ist eine quelloffene Clean-Room-Neuimplementierung der Claude Code Agent-Harness-Architektur, in Python und Rust von Entwickler Sigrid Jin in den Stunden nach dem jüngsten Source-Leak gebaut. Es erfasst die Architekturmuster von Claude Code, ohne proprietären Code zu kopieren. Kostenlos nutzbar, selbst gehostet und aktiv weiterentwickelt.

Diese sind keine direkten Konkurrenten im traditionellen Sinne. Eines ist ein ausgereiftes, unternehmensseitig unterstütztes Produkt. Das andere ist eine community-getriebene Architekturstudie, die zufällig tatsächlich läuft.

Architekturvergleich

Sprache und Laufzeitumgebung

Claude Codes geleakter Quellcode umfasste ungefähr 512.000 Zeilen TypeScript in 1.906 Dateien — eine massive, kampferprobte Codebasis, die als npm-Paket ausgeliefert wird. Sie läuft auf Node.js, integriert sich direkt in VS Code und JetBrains über Erweiterungen und streamt Antworten via SSE.

claw-code ist mit einem Python + Rust-Hybrid gebaut. Laut den eigenen Architekturdokumenten des Projekts umfasst Rust derzeit 72,9% der Codebasis (leistungskritische Pfade, ein Zero-Dependency-JSON-Parser, OAuth PKCE-Flow, Terminal-Rendering), während Python die Agent-Orchestrierung und LLM-Integration mit 27,1% übernimmt. Es gibt einen aktiven dev/rust-Branch, der auf eine vollständig speichersichere Laufzeitumgebung abzielt.

Der praktische Unterschied: Claude Code ist stabil, kampferprobt und läuft mit einem einzigen npm install. claw-code erfordert Python-Setup, befindet sich noch in aktiver Entwicklung, und die Rust-Migration ist noch nicht in main zusammengeführt.

# Claude Code Installation — ein Befehl, fertig
npm install -g @anthropic-ai/claude-code

# claw-code — klonen, konfigurieren, ausführen
git clone https://github.com/instructkr/claw-code
cd claw-code
pip install -r requirements.txt
python src/main.py

Multi-Agent-Orchestrierungsunterstützung

Dies ist einer der faszinierenderen Teile des Leaks. Claude Codes interne Architektur enthält ein “Swarm”-System zum Erzeugen von Sub-Agenten, die komplexe Engineering-Aufgaben parallelisieren — jeder läuft in isolierten Kontexten mit gemeinsamem Speicherzugriff. Die Model Context Protocol-Spezifikation stellt den zugrundeliegenden Standard bereit, nach dem diese Tool-Calling-Interaktionen strukturiert sind.

claw-code dokumentiert und reimplementiert dies über sein Agent-Tool — einen Sub-Agenten-Spawner, der große Aufgaben in unabhängig ausführbare Teilaufgaben zerlegt. Ob die Koordinationsqualität mit Claude Codes Produktions-Tuning mithalten kann, ist noch nicht im großen Maßstab getestet, aber das Architekturmuster ist vorhanden.

MCP und Tool-Integration

Beide Tools unterstützen das Model Context Protocol. Die Implementierung von claw-code dokumentiert sechs Transporttypen: Stdio, SSE, HTTP, WebSocket, SDK und ClaudeAiProxy — mit automatischer Namensnormalisierung, Config-Hashing und OAuth-Authentifizierung. Das ist auf dem Papier tatsächlich ein breiterer Bereich, als viele Entwickler von einer Community-Neuimplementierung erwarten würden.

Claude Codes MCP-Unterstützung ist ausgereifter und besser auf der Claude Code Docs-Website dokumentiert, mit offiziellen Integrationen, die gegen echte Server-Implementierungen getestet wurden. Für produktive MCP-Workflows ist das relevant.

Berechtigungs- und Sandbox-Modell

Claude Code läuft mit expliziten, granularen Berechtigungskontrollen. Wenn es Dateizugriff oder Shell-Ausführung benötigt, fragt es nach. Anthropic unterhält dedizierte Sicherheitsinfrastruktur, führt regelmäßige Audits durch und verwaltet die Vertrauensgrenze zwischen dem Agenten und deinem System. Das Remote Control-Feature, das Anfang 2026 hinzugefügt wurde, ermöglicht nativen mobilen Zugriff ohne eingehende Ports freizugeben.

claw-code implementiert eine Berechtigungskontext-Verwaltungsschicht (siehe permissions.py im Quellbaum) mit 19 berechtigungsgesicherten Tools. Jedes Tool — Dateilesen, Bash-Ausführung, Git-Operationen, Web-Scraping, LSP-Integration — hat seine eigenen Zugriffskontrollen. Die Architektur ist solide. Die Frage ist, wie gründlich sie geprüft wurde.

Es ist erwähnenswert: Ein Supply-Chain-Angriff am 31. März 2026 betraf npm-basierte Claude Code-Installationen während des Leak-Fensters. claw-code selbst war nicht betroffen, aber das breitere Ökosystem erfordert Vorsicht. Der OWASP-Leitfaden zur Software-Supply-Chain-Sicherheit ist vor dem Einsatz eines Drittanbieter-Agenten in der Produktion lesenswert.

Was claw-code hat, was noch fehlt

Aktueller Status der Feature-Parität

Was hinter unveröffentlichten Flags im Original steckt

Das Source-Leak enthüllte 44 kompilierte Feature-Flags in Claude Codes Codebasis — von denen 20 für externe Benutzer deaktiviert bleiben. Das ist eine erhebliche interne Pipeline vor öffentlichen Releases. Drei stechen hervor:

KAIROS-Modus: Ein kontinuierlich laufender, proaktiver Assistent, der deine Entwicklungsumgebung beobachtet und autonom handelt, ohne auf Benutzereingaben zu warten. Unterstützt durch ein unabhängiges, nur anhängbares Protokoll.

ULTRAPLAN-Modus: Lagert komplexe Architekturplanung in einen entfernten Cloud-Container aus, der ein Opus-Klasse-Modell mit bis zu 30 Minuten dedizierter Reasoning-Zeit und browserbasierten menschlichen Genehmigungsworkflows ausführt.

autoDream-Service: Eine Hintergrund-Speicherkonsolidierungs-Engine — intern als “Träumen”-Mechanismus des Systems beschrieben — die gelernte Muster neu organisiert und veralteten Kontext während der Leerlaufzeit bereinigt.

Keines davon ist noch in claw-code implementiert. Sie repräsentieren die Lücke zwischen dem, was man durch Reverse Engineering erschließen kann, und dem, was Monate an Produktions-Tuning benötigt, um zuverlässig zu werden.

Entscheidungsmatrix: Wann macht welches Tool Sinn?

Experimentelle Nutzung und Architekturforschung

claw-code ist hier wirklich interessant. Wenn du verstehen möchtest, wie ein produktionstauglicher KI-Coding-Agent tatsächlich Tools verdrahtet, Laufzeitkontext verwaltet und Sub-Agenten orchestriert — die Codebasis ist lesbar, dokumentiert, und das GitHub-Repo enthält ein Paritätsaudit gegen die TypeScript-Quelle. Für Entwickler, die agentische Systemdesigns studieren, ist das wertvoll.

Der Anthropic-Forschungsblog über Agentenarchitekturen bietet nützlichen Kontext, um zu verstehen, woher die Designentscheidungen in Claude Code stammen.

Produktionstaugliche agentische Workflows

Claude Code. Nicht weil claw-code nicht clever wäre — das ist es — sondern weil produktive Workflows Stabilität, offizielle Sicherheitsaudits, konsistente Modellqualität und Support benötigen, wenn um 2 Uhr nachts etwas kaputt geht. Claude Codes Fehlerwiederherstellung über lange Sitzungen und seine Kontextbeibehaltung sind Features, die gegen Milliarden realer Tokens abgestimmt wurden.

Bewertungskriterien für Teams

Diese Tabelle ehrlich nutzen:

FAQ

F: Ist claw-code produktionsreif?

Nach meiner ehrlichen Einschätzung noch nicht. Das Python-Fundament ist für begrenzte Aufgaben funktional, aber die Rust-Neuimplementierung ist noch in Arbeit auf einem separaten Branch, die IDE-Integrationen existieren nicht, und die Multi-Agent-Orchestrierung wurde noch nicht im großen Maßstab kampferprobt. Es entwickelt sich schnell — 48k Sterne in wenigen Tagen bedeutet viele Mitwirkende — aber “interessante Architektur” und “produktionsreif” sind unterschiedliche Maßstäbe.

F: Unterstützt claw-code MCP-Server?

Ja, auf dem Papier. Das Projekt dokumentiert sechs Transporttypen einschließlich Stdio, SSE, HTTP und WebSocket. In der Praxis ist die Implementierung neuer und weniger getestet als die von Claude Code. Wenn MCP-Server-Stabilität für deinen Workflow wichtig ist, ist Claude Code vorerst sicherer. Schau dir die MCP-Spezifikation an, um zu verstehen, was vollständige Compliance tatsächlich erfordert.

F: Kann claw-code sich mit Nicht-Anthropic-Modellanbietern verbinden?

Ja — das ist einer seiner echten Vorteile. claw-code ist mit einer anbieterunabhängigen LLM-Abstraktionsschicht konzipiert, was bedeutet, dass du es auf OpenAI, Gemini oder lokale Modelle über Ollama richten kannst. Claude Code ist auf Anthropics Modelle beschränkt. Wenn Modellflexibilität wichtig ist (und das wird zunehmend so, da sich die Landschaft verändert), hat claw-code hier einen strukturellen Vorteil.

F: Was passiert, wenn Anthropic weitere rechtliche Schritte gegen claw-code einleitet?

Das Projekt ist als Clean-Room-Neuimplementierung konzipiert — es wurde kein proprietärer Code kopiert, nur Architekturmuster wurden studiert und unabhängig reimplementiert. Das ist derselbe rechtliche Ansatz, der erfolgreich von Projekten wie Wine und ReactOS verwendet wurde. Allerdings hat Anthropic zum Zeitpunkt dieses Schreibens keine öffentlichen rechtlichen Schritte gegen das instructkr-Repo eingeleitet. Der Betreuer des Projekts macht die Clean-Room-Methodik in der README explizit.

F: Ist die Rust-Neuimplementierung von claw-code näher an der Produktionsnutzung?

Der dev/rust-Branch ist aktiv, und die eigene Dokumentation des Projekts besagt, dass der 6-Crate Rust-Workspace 16 Laufzeitmodule mit bereits implementierten leistungskritischen Pfaden enthält. Aber “aktive Entwicklung” und “merge-bereit” sind verschiedene Dinge. Basierend auf der aktuellen Aktivität würde ich erwarten, dass der Rust-Kern in den nächsten Monaten stabilisiert — aber baue keine Produktions-Pipeline auf dieser Zeitplanannahme auf.

Vorherige Beiträge: