Kling 2.6 Motion Control : Les Patterns de Prompt Qui Bougent Vraiment les Bonnes Parties
Quelques jours après avoir commencé à tester Kling 2.6, j’ai continué à buter sur le même problème : je demandais un geste de la main et l’épaule entière s’écartait, ou je demandais à la caméra de faire un zoom avant et le sujet se penchait en avant comme s’il avait été tiré par une corde. Pas des défaillances dramatiques, juste ce problème récurrent de « bouger la mauvaise partie » qui érode lentement la confiance.
J’ai donc consacré un après-midi, j’ai préparé du café, et j’ai essayé de comprendre à quoi le modèle prêtait vraiment attention lorsqu’il décidait quoi bouger. Ce qui suit n’est pas un avis. Ce sont les notes que j’aurais aimé avoir le premier jour : comment j’ai orienté Kling 2.6 vers un contrôle de mouvement fiable sans transformer chaque prompt en paragraphe.
Pourquoi « bouger la mauvaise partie » arrive
Kling 2.6 est bon pour les mouvements plausibles. Il est moins bon pour les mouvements précis. Quand je lui ai demandé de « lever sa main droite », j’ai découvert que le modèle ne se contente pas d’analyser les mots : il s’appuie aussi sur les a priori appris sur la façon dont les corps se meuvent généralement et sur ce que la caméra fait généralement. Croyez-moi, c’est là que le plaisir commence vraiment.
Voici les schémas que j’ai observé régulièrement :
- Référents ambigus : S’il y a deux acteurs plausibles (sujet et caméra), Kling assigne parfois le mouvement à la caméra parce que cela maintient les scènes stables. « Faire un zoom avant » peut devenir le sujet marchant en avant.
- Occlusion + symétrie : Si la main droite est partiellement cachée ou a une pose similaire à la gauche, elle miroir ou s’échange. L’éclairage latéral et le cadrage aident plus que les mots ici.
- Flou temporel : Sans repères ou durée, le mouvement s’étale sur l’ensemble du clip. C’est à ce moment que vous obtenez des micro-vibrations perpétuelles ou un sujet qui ne peut pas rester immobile.
Rien de tout cela n’est un bug. C’est le modèle qui opte pour le réalisme. La solution, pour moi, était de parler à Kling comme un directeur de mouvement parle à une petite équipe : qui bouge, quelle partie, de combien, à quelle vitesse, et ce qui reste verrouillé.
Checklist de tokens de mouvement
Kling ne nécessite pas de syntaxe spéciale, mais me donner un petit modèle « token de mouvement » m’a tenu honnête. Je les ai écrit en ligne, en langage naturel, comme des étiquettes à l’intérieur du prompt. Voilà — c’est fait une énorme différence.
Mon modèle de token ressemble à ceci :
- Acteur : qui bouge (sujet, main gauche, caméra, lumière de fond). Un acteur par token.
- Action : le verbe, gardé court quand la précision importe (pencher, jeter un regard, lever, tourner légèrement).
- Côté/partie : membre ou objet exact (poignet droit, sourcil gauche, index, tangage caméra).
- Magnitude : petit, moyen, grand, ou degrés/comptes si nécessaire (15°, 2 pas, 3 images).
- Durée + timing : quand c’est arrivé et combien de temps (beat 1–2 sec, tenir 1 sec, boucle).
- Contrainte : ce qui reste immobile (torse verrouillé, caméra verrouillée, expression neutre).
- Négatif : ce qui ne doit pas bouger (pas de décalage d’épaule, pas de zoom, cheveux calmes).
J’enveloppe généralement ces éléments entre crochets pour les garder lisibles, encore une fois, pour moi, pas pour Kling :
[actor: right hand] [action: wave] [magnitude: small] [duration: 1s] [constraint: shoulder locked] [negative: no camera movement]
Motif 1 : contrôle des membres
Le problème des membres est le classique. Je voulais un geste de main subtil sans une oscillation du haut du corps entier. Mes premières tentatives ont échoué parce que j’ai demandé « un geste doux ». Kling a entendu « geste » et a animé toute la chaîne.
Ce qui a mieux fonctionné :
- Nommez d’abord l’articulation qui bouge la plus petite. « Poignet droit qui frétille, les doigts mènent, l’épaule reste neutre. »
- Ajoutez une contre-contrainte. « Torse ancré à la chaise. Pas d’oscillation des hanches. »
- Donnez-lui un temps. « Le geste se produit à 0:02–0:03, puis repos. »
- Gardez la symétrie en échec. « La main gauche reste sur la table, immobile. »
Un vrai morceau de prompt qui a produit un mouvement propre :
« Le sujet s’assoit à un bureau en bois. Lumière calme. Le poignet droit fait un petit geste de gauche à droite, les doigts effectuant la plupart du mouvement. L’épaule et le coude restent réguliers. Ce mouvement se produit une fois entre 2–3 secondes, puis la main retourne reposer sur le bureau. La main gauche reste immobile. Pas de mouvement caméra. »
Quand il importe d’être précis, je mets un repère visuel : « Le poignet droit repose à côté de la tasse de café : seuls les doigts bougent. » Les repères réduisent l’incertitude du modèle sur l’endroit où les articulations se trouvent.
Motif 2 : caméra
La moitié de mes clips « mauvaise partie a bougé » étaient vraiment des échanges caméra–sujet. J’ai demandé un « zoom avant doux » et le modèle a fait pencher le sujet en avant. Raisonnable, mais pas ce que je voulais.
Comment j’ai séparé les deux :
- Déclarez un rig caméra. « Caméra sur trépied, zoom 5% subtil sur 2 secondes. »
- Geler le sujet. « Le sujet reste complètement immobile, respirant seulement. »
- Évitez les verbes qui ressemblent à des actions du corps. Je dis « zoom avant » ou « dolly avant », pas « se rapprocher ».
- Utilisez des nombres. « 5% zoom, linéaire, 2s, centré. »
Un morceau de prompt qui s’est comporté :
« Plan figé. La caméra effectue un zoom avant linéaire lent de 5% de 0–2 secondes. Le sujet ne se penche pas ni ne marche. Pas de changement de parallaxe. L’arrière-plan reste fixe. »
Si je veux une parallaxe (un dolly), je l’appelle : « dolly caméra avant, parallaxe peu profonde sur la bibliothèque, sujet verrouillé au centre du cadre. » Cette seule ligne arrête le modèle de simuler le mouvement avec un pencher du sujet.
Une dernière note : Kling 2.6 ajoute parfois une instabilité caméra portée pour « le cinéma ». Si vous ne voulez pas ça, dites-le : « pas de tremblement de caméra portée, pas de micro-vibrations. »
Motif 3 : micro-mouvement
Le micro-mouvement est l’endroit où Kling 2.6 m’a surpris de la bonne manière. Les petits changements constants tendent à avoir l’air naturel — saccades oculaires, respiration, dérive du tissu — si vous gardez les verbes doux et les durées courtes.
Ce qui a fonctionné :
- Yeux : « deux petites saccades oculaires gauche→centre dans la première seconde, paupières douces, tête immobile. »
- Respiration : « montée subtile du thorax 4–6 mm sur 3 secondes, puis descente, boucle une fois. »
- Tissu/cheveux : « brise à peine perceptible, les pointes des cheveux bougent, les racines stables : l’ourlet de la veste frémit pendant 0.5s. »
- Accessoires : « la vapeur s’enroule à partir de la tasse, mince, intermittente, pas turbulente. »
Ce qui n’a pas fonctionné :
- Empiler plusieurs micros à la fois. Ça se transforme en bruit.
- Utiliser de grands verbes avec des cibles micro (« tourner la tête légèrement » devient souvent un hochement complet). J’utilise « angle », « pencher », « s’installer », « dériver ».
Quand les clips devenaient trop vivants, j’ai ajouté un plafond : « l’arrière-plan reste immobile : seulement [X] bouge. » Cette seule ligne réduisait les oscillations accidentelles à travers le cadre.
Prompts négatifs
Les prompts négatifs sont moins pour bannir les artefacts et plus pour allouer le budget de mouvement. J’ai obtenu de meilleurs résultats quand j’ai utilisé les négatifs pour geler des chaînes spécifiques.
Les négatifs utiles sur lesquels je me suis appuyé :
- « Pas d’implication des épaules. » Force le modèle à localiser le mouvement de la main.
- « Pas de mouvement caméra d’aucune sorte. » Élimine le tremblement par défaut.
- « Les cheveux restent calmes. » Empêche le modèle de « cinématisfier » les scènes avec du vent.
- « Pas de changement d’expression faciale. » Gardez les micro-mouvements de dériver en sourires.
- « Pas de zoom ou de dolly. » Évite l’échange sujet/caméra.
Et une petite mise en garde : les longues listes négatives peuvent se retourner. Deux ou trois négatifs ciblés battent une liste exhaustive.
Pour la cohérence lors du test de ces prompts, nous exécutons nos expériences Kling sur WaveSpeed (notre environnement GPU interne) pour itérer et comparer les exécutions sans dérive d’installation.

10 prompts prêts
Ce sont des démarreurs courts et fonctionnels que j’ai utilisés. Modifiez les sujets et les styles, mais gardez les bits de mouvement intacts.
1. Geste de poignet propre, torse tranquille
« Une personne assise à un bureau en bois, lumière du jour.
[actor: right wrist] [action: small side-to-side wave] [magnitude: small]
[timing: 2.0–3.0s, once] [constraint: shoulder and elbow steady]
[negative: no camera movement, no left-hand motion]. »
2. Zoom avant caméra subtil, sujet gelé
« Cadrage portrait, arrière-plan neutre.
[actor: camera] [action: zoom-in] [magnitude: 5%] [duration: 0–2s, linear]
[constraint: subject perfectly still, only breathing]
[negative: no dolly, no handheld shake]. »
3. Saccades oculaires sans mouvement de la tête
« Gros plan du visage, lumière douce.
[actor: eyes] [action: two quick saccades left→center]
[timing: within first second]
[constraint: head locked, expression neutral]
[negative: no smile, no blink during saccades]. »
4. Tourner la page avec le doigt, pas tout le bras
« Plan aérien d’un cahier ouvert.
[actor: right index finger] [action: slide page corner and flip]
[magnitude: single page] [timing: 1.5–2.5s]
[constraint: wrist minimal, forearm anchored to table]
[negative: no camera move]. »
5. Inclinaison de tête d’acquiescement, micro seulement
« Plan moyen.
[actor: head] [action: small tilt right then return] [magnitude: 5–7°]
[timing: 1.0–1.4s]
[constraint: shoulders level]
[negative: no smile, no eye shift]. »
6. Dolly vers la droite avec parallaxe, sujet ancré
« Scène studio.
[actor: camera] [action: dolly-right] [magnitude: small, 20 cm]
[duration: 0–2s, smooth]
[constraint: subject remains center-framed, background parallax visible]
[negative: no zoom]. »
7. Micro-tremblement du tissu seulement
« Portrait avec brise légère.
[actor: jacket hem] [action: brief flutter]
[timing: 0.8–1.2s]
[constraint: hair and foliage still]
[negative: no global wind]. »
8. Dactylographie avec doigts isolés
« Scène de bureau, ordinateur portable.
[actor: fingers both hands] [action: type softly]
[timing: intermittent bursts]
[constraint: wrists planted, elbows steady, torso still]
[negative: no camera shake]. »

9. Lever une tasse sans lever les épaules
« Table de café.
[actor: right hand] [action: lift ceramic cup, sip, replace]
[timing: 1.0–2.5s]
[constraint: shoulder and neck quiet, minimal elbow]
[negative: no camera move, no steam surge]. »
10. Mouvement de l’arrière-plan pendant que le sujet tient bon
« Portrait de rue.
[actor: background pedestrians] [action: slow pass left→right]
[constraint: subject motionless, eyes at camera]
[negative: no subject sway, no zoom]. »
Si vous devez escalader la précision, empiler une contrainte de plus plutôt qu’une action supplémentaire. Ça garde le clip lisible, pour vous et pour le modèle. Pas de jugement ici — on y est tous passé.
Bon, à votre tour — ne me laissez pas en suspens : Quelle est la surprise de licence « open weights » la plus ridicule que vous ayez rencontrée ? Déposez votre histoire dans les commentaires !





