Kling 2.6 Motion Control: Prompt-Muster, die wirklich die richtigen Teile bewegen
Vor ein paar Tagen beim Testen von Kling 2.6 stolperte ich immer wieder über dasselbe Problem: Ich bat um eine Handbewegung und die ganze Schulter driftete weg, oder ich bat die Kamera, näher heranzufahren, und die Person lurcht nach vorne, als würde sie an einer Schnur gezogen. Keine dramatischen Fehler, nur dieses unterschwellige „falscher Teil bewegt sich”-Problem, das langsam das Vertrauen aushöhlt.
Also setzte ich einen Nachmittag beiseite, machte Kaffee und versuchte zu verstehen, worauf das Modell wirklich hört, wenn es entscheidet, was sich bewegen soll. Das Folgende ist keine Rezension. Es sind die Notizen, die ich mir am ersten Tag hätte machen sollen: wie ich Kling 2.6 zu zuverlässiger Bewegungskontrolle bewegt habe, ohne jeden Prompt in einen Absatz zu verwandeln.
Warum „falscher Teil bewegt sich” passiert
Kling 2.6 ist gut bei plausiblen Bewegungen. Es ist weniger gut bei chirurgischen Bewegungen. Als ich es fragte „hebe ihre rechte Hand”, lernte ich, dass das Modell nicht nur die Wörter analysiert: es lehnt sich auch auf gelernte Voraussetzungen an darüber, wie sich Körper normalerweise bewegen und was die Kamera normalerweise tut. Vertrau mir, das ist, wenn der Spaß wirklich anfängt.
Hier sind die Muster, die ich immer wieder sah:
- Mehrdeutige Referenten: Wenn es zwei plausible Akteure gibt (Subjekt und Kamera), weist Kling die Bewegung manchmal der Kamera zu, weil das Szenen stabil hält. „Näher heranfahren” kann zur Person werden, die nach vorne geht.
- Verdeckung + Symmetrie: Wenn die rechte Hand teilweise verborgen ist oder der linken in der Pose ähnelt, spiegelt oder tauscht sie Seiten. Seitenlicht und Framing helfen hier mehr als Wording.
- Zeitliche Unklarheit: Ohne Beats oder Dauer schmieren Bewegungen über den ganzen Clip. Das ist, wenn du ewiges Mikrozittern oder eine Person bekommst, die nicht stillstehen kann.
Nichts davon ist ein Bug. Das Modell sichert sich für Realismus ab. Die Lösung, für mich, war, mit Kling zu sprechen, wie ein Motion Director mit einer kleinen Crew spricht: wer bewegt sich, welcher Teil, wie weit, wie schnell, und was bleibt gesperrt.
Bewegungs-Token Checkliste
Kling erfordert keine spezielle Syntax, aber mir selbst eine kleine „Bewegungs-Token”-Vorlage zu geben hielt mich ehrlich. Ich schrieb sie inline, in Klartext, wie Etiketten im Prompt. Die Sache ist — es machte einen riesigen Unterschied.
Meine Token-Vorlage sieht etwa so aus:
- Akteur: wer bewegt sich (Subjekt, linke Hand, Kamera, Hintergrundlicht). Ein Akteur pro Token.
- Aktion: das Verb, klein gehalten, wenn Präzision wichtig ist (neigen, schauen, heben, leicht drehen).
- Seite/Teil: exakte Gliedmaße oder Objekt (rechtes Handgelenk, linke Augenbraue, Zeigefinger, Kamera-Gieren).
- Magnitude: klein, mittel, groß, oder Grad/Zähler wenn nötig (15°, 2 Schritte, 3 Frames).
- Dauer + Timing: wann es passiert und wie lange (Beat 1–2 Sek, 1 Sek halten, Schleife).
- Constraint: was bleibt still (Torso gesperrt, Kamera gesperrt, Gesicht neutral).
- Negativ: was darf nicht bewegen (keine Schulterverlagerung, kein Zoom, Haare bleiben ruhig).
Ich wickle diese normalerweise in Klammern ein, um sie für mich lesbar zu halten, wieder, für mich, nicht für Kling:
[Akteur: rechte Hand] [Aktion: winken] [Magnitude: klein] [Dauer: 1s] [Constraint: Schulter gesperrt] [Negativ: keine Kamerabewegung]
Muster 1: Gliedmaßenkontrolle
Das Gliedmaßenproblem ist das klassische. Ich wollte eine subtile Handbewegung ohne vollständiges Oberkörper-Schwanken. Meine ersten Versuche schlugen fehl, weil ich um „eine sanfte Welle” bat. Kling hörte „winken” und animierte die ganze Kette.
Was besser funktionierte:
- Benenne zuerst das kleinste bewegliche Gelenk. „Rechtes Handgelenk-Schnelle Bewegung, Finger führen, Schulter bleibt neutral.”
- Füge eine Gegen-Constraint ein. „Torso verankert auf Stuhl. Keine Hüftbewegung.”
- Gib ihm einen Beat. „Welle tritt bei 0:02–0:03 auf, dann Ruhe.”
- Halte Symmetrie in Schach. „Linke Hand bleibt auf dem Tisch, still.”
Ein echtes Prompt-Snippet, das saubere Bewegung erzeugte:
„Person sitzt an einem Holzschreibtisch. Ruhiges Licht. Rechtes Handgelenk macht eine kleine Seiten-zu-Seiten-Welle, Finger tun den Großteil der Bewegung. Schulter und Ellbogen bleiben stabil. Diese Bewegung passiert einmal zwischen 2–3 Sekunden, dann kehrt die Hand zu Ruhelage auf dem Schreibtisch zurück. Linke Hand bleibt still. Keine Kamerabewegung.”
Wenn es wichtig ist, präzise zu sein, setze einen visuellen Anker: „Rechtes Handgelenk ruht neben der Kaffeetasse: nur Finger bewegen sich.” Anker reduzieren die Unsicherheit des Modells über den Ort von Gelenken.
Muster 2: Kamera
Die Hälfte meiner „falscher Teil bewegte sich”-Clips waren wirklich Kamera–Subjekt-Swaps. Ich bat um eine „sanfte Heranfahrt” und das Modell machte das Subjekt nach vorne lehnen. Nachvollziehbar, aber nicht das, was ich wollte.
Wie ich die beiden trennte:
- Deklariere ein Kamera-Rig. „Kamera auf Stativ, subtiler 5%-Zoom über 2 Sekunden.”
- Friere das Subjekt ein. „Subjekt bleibt völlig still, nur atmen.”
- Vermeide Verben, die wie Körperaktionen klingen. Ich sage „Zoom-rein” oder „Dollying-rein”, nicht „näher bewegen.”
- Verwende Nummern. „5% Zoom, linear, 2s, zentriert.”
Ein Prompt-Snippet, das sich verhielt:
„Gesperrte Aufnahme. Kamera führt einen langsamen, linearen 5%-Zoom von 0–2 Sekunden durch. Subjekt lehnt sich nicht und tritt nicht auf. Keine Parallaxen-Änderung. Hintergrund bleibt fixiert.”
Wenn ich Parallaxe will (ein Dolly), nenne ich es: „Kamera Dolly-rein, flache Parallaxe auf Bücherregal, Subjekt auf Frame-Center gesperrt.” Diese eine Zeile hält das Modell ab, die Bewegung mit einer Subjekt-Neigung zu fälschen.
Eine weitere Notiz: Kling 2.6 fügt manchmal tragbares Wackeln für „Kino” hinzu. Wenn du das nicht willst, sag es: „kein tragbares Schütteln, kein Mikrozittern.”
Muster 3: Mikrobewegung
Mikrobewegung ist, wo Kling 2.6 mich auf gute Weise überraschte. Kleine, stabile Veränderungen sehen natürlich aus — Augensakkaden, Atmung, Stoff-Drift — wenn du Verben sanft und Dauern kurz hältst.
Was funktionierte:
- Augen: „zwei kleine Augensakkaden links→Mitte in der ersten Sekunde, Augenlider sanft, Kopf still.”
- Atmung: „subtiler Brustanstieg 4–6 mm über 3 Sekunden, dann Fall, einmal wiederholt.”
- Stoff/Haar: „kaum merklicher Luftzug, Haarspitzen bewegen sich, Wurzeln stabil: Jackensaum flattert für 0,5s.”
- Requisiten: „Dampf kräuselt sich aus Tasse, dünn, intermittierend, nicht turbulent.”
Was nicht funktionierte:
- Stapelung vieler Mikros auf einmal. Es wird zu Lärm.
- Verwendung großer Verben mit Mikro-Zielen („Kopf leicht drehen” wird oft zum vollen Nicken). Ich verwende „Winkel”, „Neigung”, „Ruhe”, „Drift”.
Wenn Clips zu lebendig wurden, fügte ich eine Obergrenze hinzu: „Hintergrund bleibt unbeweglich: nur [X] bewegt sich.” Diese einzelne Zeile reduzierte zufällige Wackler über den Frame.
Negative Prompts
Negative Prompts handeln weniger vom Verbannen von Artefakten und mehr von der Zuweisung des Bewegungsbudgets. Ich bekam bessere Ergebnisse, wenn ich Negative nutzte, um spezifische Ketten zu frieren.
Nützliche Negative, auf die ich angewiesen war:
- „Keine Schulter-Beteiligung.” Erzwingt das Modell, die Handbewegung zu lokalisieren.
- „Keine Kamerabewegung jeglicher Art.” Tötet das Standard-Wackeln.
- „Haare bleiben ruhig.” Verhindert, dass das Modell Szenen mit Wind „verfilmt”.
- „Keine Gesichtsausdrucksveränderung.” Hält Mikrobewegungen ab, in Lächeln zu driften.
- „Kein Zoom oder Dolly.” Vermeidet den Subjekt/Kamera-Swap.
Und eine kleine Warnung: lange negative Listen können nach hinten losgehen. Zwei oder drei zielgerichtete Negative schlagen eine Waschliste.
Für Konsistenz beim Testen dieser Prompts führen wir unsere Kling-Experimente auf WaveSpeed (unserer internen GPU-Umgebung) durch, um zu iterieren und Läufe ohne Setup-Drift zu vergleichen.

10 einsatzbereite Prompts
Dies sind kurze, funktionsfähige Starter, die ich verwendet habe. Tweake Subjekte und Stile, aber behalte die Bewegungsteile intakt.
1. Saubere Handgelenk-Welle, Torso ruhig
„Eine sitzende Person an einem Holzschreibtisch, Tageslicht.
[Akteur: rechtes Handgelenk] [Aktion: kleine Seiten-zu-Seiten-Welle] [Magnitude: klein]
[Timing: 2,0–3,0s, einmal] [Constraint: Schulter und Ellbogen stabil]
[Negativ: keine Kamerabewegung, keine Bewegung der linken Hand].“
2. Subtiler Kamera-Push-in, Subjekt gefroren
„Portrait-Framing, neutraler Hintergrund.
[Akteur: Kamera] [Aktion: Zoom-rein] [Magnitude: 5%] [Dauer: 0–2s, linear]
[Constraint: Subjekt vollkommen still, nur atmen]
[Negativ: kein Dolly, kein tragbares Schütteln].“
3. Augensakkaden ohne Kopfbewegung
„Nahaufnahme Gesicht, weiches Licht.
[Akteur: Augen] [Aktion: zwei schnelle Sakkaden links→Mitte]
[Timing: innerhalb der ersten Sekunde]
[Constraint: Kopf gesperrt, Ausdruck neutral]
[Negativ: kein Lächeln, kein Blinken während Sakkaden].“
4. Seite mit Finger umblättern, nicht ganzer Arm
„Vogelperspektive eines offenen Notizbuchs.
[Akteur: rechter Zeigefinger] [Aktion: Seitenecke schieben und umblättern]
[Magnitude: einzelne Seite] [Timing: 1,5–2,5s]
[Constraint: Handgelenk minimal, Unterarm auf Tisch verankert]
[Negativ: keine Kamerabewegung].“
5. Kopfneigung Bestätigung, nur Mikro
„Mittlerer Schuss.
[Akteur: Kopf] [Aktion: kleine Neigung rechts dann zurück] [Magnitude: 5–7°]
[Timing: 1,0–1,4s]
[Constraint: Schultern eben]
[Negativ: kein Lächeln, keine Augenverschiebung].“
6. Dolly-rechts mit Parallaxe, Subjekt verankert
„Studio-Szene.
[Akteur: Kamera] [Aktion: Dolly-rechts] [Magnitude: klein, 20 cm]
[Dauer: 0–2s, sanft]
[Constraint: Subjekt bleibt zentriert, Hintergrund-Parallaxe sichtbar]
[Negativ: kein Zoom].“
7. Stoff-Mikro-Flattern nur
„Portrait mit leiser Brise.
[Akteur: Jackensaum] [Aktion: kurzes Flattern]
[Timing: 0,8–1,2s]
[Constraint: Haare und Laub still]
[Negativ: kein globaler Wind].“
8. Tippen mit isolierten Fingern
„Schreibtisch-Szene, Laptop.
[Akteur: Finger beide Hände] [Aktion: sanft tippen]
[Timing: unterbrochene Schübe]
[Constraint: Handgelenke gepflanzt, Ellbogen stabil, Torso still]
[Negativ: keine Kameravibration].”

9. Tasse heben ohne Schulterheben
„Café-Tisch.
[Akteur: rechte Hand] [Aktion: Keramiktasse heben, schlürfen, ablegen]
[Timing: 1,0–2,5s]
[Constraint: Schulter und Nacken ruhig, minimaler Ellbogen]
[Negativ: keine Kamerabewegung, kein Dampfanstieg].“
10. Hintergrund-Bewegung während Subjekt hält
„Straßen-Portrait.
[Akteur: Hintergrund-Fußgänger] [Aktion: langsamer Vorbeigang links→rechts]
[Constraint: Subjekt unbeweglich, Augen auf Kamera]
[Negativ: keine Subjekt-Schwankung, kein Zoom].”
Wenn du Präzision skalieren musst, stapele lieber eine weitere Constraint als eine weitere Aktion. Es hält den Clip lesbar, für dich und für das Modell. Kein Urteil hier — wir sind alle da gewesen.
Alles klar, jetzt bist du dran — lass mich nicht hängen: Was ist die verrückteste „Open Weights”-Lizenz-Überraschung, die du getroffen hast? Lass deine Geschichte in den Kommentaren!





