Kling 2.6 モーションコントロール: 実際に正しい部分を動かすプロンプトパターン
Kling 2.6のテストを始めて数日で、同じ問題につまずき続けました。手を振るように頼めば肩全体がずれてしまい、カメラをプッシュインするよう頼めば被写体が紐で引っ張られたように前に飛び出す。劇的な失敗ではなく、ただ「間違った部分が動く」という低レベルの問題が少しずつ信頼を蝕んでいくのです。
そこで午後を確保して、コーヒーを淹れて、このモデルが何を動かすか決めるときに実際に何を聞いているのかを理解しようと試みました。以下のものはレビューではありません。1日目に欲しかったノートです。すべてのプロンプトを段落に変えることなく、Kling 2.6を信頼できるモーションコントロールに導いた方法についてです。
なぜ「間違った部分が動く」が起きるのか
Kling 2.6は妥当なモーションに優れています。外科的なモーションにはあまり優れていません。「彼女の右手を上げて」と頼んだとき、このモデルが単に言葉を解析しているだけでなく、体が通常どのように動くか、カメラが通常何をするかについての学習済みの先験知に依存していることを学びました。信じてください、そこから本当の楽しみが始まるのです。

パターンとして何度も見たものを以下に示します。
- 曖昧な指示対象: 2つのもっともらしい動き手(被写体とカメラ)がある場合、Klingはシーンを安定させるため、モーションをカメラに割り当てることがあります。「プッシュイン」は被写体が前に歩き出すになる可能性があります。
- 遮蔽+対称性: 右手が部分的に隠れている、または左の姿勢に似ている場合、ミラーするか側面を入れ替えます。サイドライティングとフレーミングは、ここでは言い回しよりも役に立ちます。
- 時間的な曖昧さ: ビート感や期間がないと、動きはクリップ全体にわたって広がります。永遠のマイクロジッターまたは静止できない被写体が得られるのはそのときです。
これらはどれもバグではありません。モデルは現実性のために保守的になっているのです。私にとっての修正方法は、モーション監督が小さなクルーに話しかける方法でKlingに話しかけることでした。誰が動くのか、どの部分が、どのくらい、どのくらいの速度で、そして何が固定されたままなのか。
モーショントークンチェックリスト
Klingは特殊な構文を必要としませんが、小さな「モーショントークン」テンプレートを自分に与えることで、自分を正直に保ちました。私はそれらをプロンプト内にインラインで、プレーンテキストで、ラベルのように書きました。要点は、それは大きな違いを生みました。
私のトークン形式は次のようになります。
- アクター: 誰が動くのか(被写体、左手、カメラ、背景光)。トークンごとに1つのアクター。
- アクション: 動詞。精度が重要な場合は小さく(傾く、一瞥する、上げる、わずかに回転)。
- 側/部分: 正確な手足またはオブジェクト(右手首、左眉、人差し指、カメラヨー)。
- 大きさ: 小、中、大、または必要に応じて度数/カウント(15°、2ステップ、3フレーム)。
- 期間+タイミング: それが起こるときと長さ(ビート1~2秒、ホールド1秒、ループ)。
- 制約: 何が静止したままか(胴体固定、カメラ固定、顔中立)。
- ネガティブ: 何が動いてはいけないか(肩シフトなし、ズームなし、髪は落ち着く)。
通常、これらを括弧で囲んでスキャン可能に保ちます。繰り返しますが、私のために、Klingのためではなく。
[actor: right hand] [action: wave] [magnitude: small] [duration: 1s] [constraint: shoulder locked] [negative: no camera movement]
パターン1:腕の制御

腕の問題は古典的なものです。上半身全体の揺れなしで微妙な手の波が欲しかった。最初の試みは「優しい波」と頼んだため失敗しました。Klingは「波」と聞いて、チェーン全体をアニメーション化しました。
より効果的だったものは以下の通りです。
- 最初に最小の移動する関節に名前を付けます。「右手首のひらめき、指がリード、肩は中立のまま。」
- カウンター制約を追加します。「胴体は椅子に固定。股関節の揺れなし。」
- ビートを与えます。「波は0:02~0:03の間に起こり、その後休む。」
- 対称性をチェックしておきます。「左手は机の上のままで、静止。」
クリーンなモーションを生成した実際のプロンプトスライス:
「被写体は木製の机に座っています。落ち着いた光。右手首は小さな左右の波を作り、指がほとんどの動きをしています。肩とひじは安定したままです。このモーション2~3秒の間に1回発生し、その後手は机の上で休むための位置に戻ります。左手は静止したままです。カメラ動きなし。」
正確さが重要なときは、視覚的なアンカーを設定します。「右手首はコーヒーマグの横に休みます。指だけが動きます。」アンカーはモデルの関節がどこにあるかについての不確実性を減らします。
パターン2:カメラ
「間違った部分が動く」クリップの半分は実はカメラ-被写体スワップでした。「優しいプッシュイン」と頼んだのに、モデルは被写体を前に傾けました。合理的ですが、私が望んでいたものではありません。
2つを分離した方法:
- カメラリグを宣言します。「三脚上のカメラ、2秒以上のこまかい5%ズームイン。」
- 被写体を凍結させます。「被写体は完全に静止したまま、呼吸のみ。」
- 体の動きのように聞こえる動詞を避けます。「ズームイン」または「ドーリーイン」と言い、「もっと近く動く」は言いません。
- 数字を使用します。「5%ズーム、リニア、2秒、中央フレーム。」
行動を示したプロンプトスライス:
「ロックオフショット。カメラは0~2秒で遅い、リニアな5%ズームインを実行します。被写体は傾いたり踏み出したりしません。視差の変化はありません。背景は固定のままです。」
視差が欲しい場合(ドーリー)、それを呼びます。「カメラドーリーイン、本棚の浅い視差、被写体はフレーム中央に固定。」その1行は、モデルが被写体リーンで動きを偽造するのを防ぎます。
もう1つ注意:Kling 2.6は時々、「シネマティック」のために手持ちのぐらつきを追加します。それが欲しくない場合は、それを言ってください。「手持ちシェイクなし、マイクロジッターなし。」
パターン3:マイクロモーション

マイクロモーションはKling 2.6が良い意味で私を驚かせたところです。動詞を優しく、期間を短く保つと、小さく安定した変化は自然に見えます。眼球の急速運動、呼吸、生地のドリフト。
効果的だったもの:
- 目: 「最初の1秒で左→中央への小さな眼球移動2回、まぶたは柔らか、頭は静止。」
- 呼吸: 「微妙な胸部の上昇4~6mm以上3秒、その後落下、1回ループ。」
- 生地/髪: 「かすかな微風、髪の先端が動き、根元は安定。ジャケットの裾が0.5秒間ひらひらしています。」
- 小道具: 「マグから湯気が渦巻き、薄く、断続的で、乱流ではありません。」
効果的ではなかったもの:
- 多くのマイクロを一度にスタックすること。ノイズになります。
- マイクロターゲットで大きな動詞を使用(「頭をわずかに回転させる」は完全なうなずきになることが多い)。「角度」「傾く」「落ち着く」「漂う」を使用します。
クリップが生きすぎたときは、天井を追加しました。「背景は動かないままです。[X]だけが動きます。」その1行は、フレーム全体の偶発的なゆらぎを減らしました。
ネガティブプロンプト
ネガティブプロンプトは、アーティファクトを追い払うことより、モーション予算を割り当てることについてです。特定のチェーンを凍結するために負の値を使用したとき、より良い結果が得られました。
活用した有用なネガティブ:
- 「肩関与なし。」モデルに手のモーションをローカライズさせます。
- 「カメラの動きは一切なし。」デフォルトのゆらゆら揺れを消します。
- 「髪は落ち着く。」モデルがシーンを「シネマティック化」するのを防ぎます。
- 「顔の表情変化なし。」マイクロモーションが笑みにドリフトするのを保つ。
- 「ズームやドーリーなし。」被写体/カメラスワップを回避します。
小さな注意:長いネガティブリストは逆効果になる可能性があります。2~3のターゲットを絞ったネガティブは長いリストに勝ります。
これらのプロンプトをテストしながら一貫性を保つために、WaveSpeed(私たちの内部GPU環境)でKlingの実験を実行して、セットアップドリフトなしで実行と比較を反復します。

10個の準備完了プロンプト
これらは私が使った短い、機能的なスターターです。被写体とスタイルを調整しますが、モーション部分は変わらないままにしておきます。
1. クリーンな手首の波、胴体は静か
「木製の机に座っている人、日中。 [actor: right wrist] [action: small side-to-side wave] [magnitude: small] [timing: 2.0–3.0s, once] [constraint: shoulder and elbow steady] [negative: no camera movement, no left-hand motion]。」
2. こまかいカメラプッシュイン、被写体は凍結
「ポートレートフレーム、中立背景。 [actor: camera] [action: zoom-in] [magnitude: 5%] [duration: 0–2s, linear] [constraint: subject perfectly still, only breathing] [negative: no dolly, no handheld shake]。」
3. 頭の動きなしの眼球急速運動
「クローズアップ顔、やさしい光。 [actor: eyes] [action: two quick saccades left→center] [timing: within first second] [constraint: head locked, expression neutral] [negative: no smile, no blink during saccades]。」
4. 指でページをめくり、腕全体ではなく
「ノートの開いたショットの上図。 [actor: right index finger] [action: slide page corner and flip] [magnitude: single page] [timing: 1.5–2.5s] [constraint: wrist minimal, forearm anchored to table] [negative: no camera move]。」
5. 頭を傾けて承認、マイクロのみ
「中程度ショット。 [actor: head] [action: small tilt right then return] [magnitude: 5–7°] [timing: 1.0–1.4s] [constraint: shoulders level] [negative: no smile, no eye shift]。」
6. ドーリーライト、視差付き、被写体は固定
「スタジオシーン。 [actor: camera] [action: dolly-right] [magnitude: small, 20 cm] [duration: 0–2s, smooth] [constraint: subject remains center-framed, background parallax visible] [negative: no zoom]。」
7. ファブリック マイクロ フラッター のみ
「ポートレート、軽い微風。 [actor: jacket hem] [action: brief flutter] [timing: 0.8–1.2s] [constraint: hair and foliage still] [negative: no global wind]。」
8. 分離した指でのキーボード入力
「机のシーン、ラップトップ。 [actor: fingers both hands] [action: type softly] [timing: intermittent bursts] [constraint: wrists planted, elbows steady, torso still] [negative: no camera shake]。」

9. 肩の上昇なしでカップをリフト
「カフェテーブル。 [actor: right hand] [action: lift ceramic cup, sip, replace] [timing: 1.0–2.5s] [constraint: shoulder and neck quiet, minimal elbow] [negative: no camera move, no steam surge]。」
10. 被写体が保持している間、背景モーション
「ストリートポートレート。 [actor: background pedestrians] [action: slow pass left→right] [constraint: subject motionless, eyes at camera] [negative: no subject sway, no zoom]。」
精度をスケーリングする必要がある場合は、別のアクションではなく1つ多く制約をスタックします。クリップを読みやすく保ちます。あなたとモデルの両方にとって。判断ありません。ここで私たちは皆、そこにいました。
さて、順番です。私を宙ぶらりんにしないでください。最も奇想天外な「オープンウェイト」ライセンスの驚きに見舞われたのは何ですか?コメント欄にあなたの話を残してください!





