Kling AI モーションコントロール:仕組みと使い方
お疲れさまです。本音を言うと、私はKling AI Motion Controlを学ぶつもりではありませんでした。ただ、カメラがボートの上にあるかのようにドリフトすることなく、テーブルの上をスライドするカップの短いクリップが欲しかっただけです。2回目の試行で、このモデルが派手さを追加するのに熱心すぎることに気づきました。モーションがふわふわしていました。その小さな不満が、1週間のテストと数回の失敗したレンダリング、そして私が早く知っておきたかったいくつかの明確なパターンへと導きました。

「Motion Control」が実際に意味すること
人々が「Kling AI Motion Control」と言うとき、彼らはしばしば同時に3つのことを意味します:
- 時間をかけて被写体の動きをガイドします(歩く、スライド、ターン、ジェスチャー)。
- シーンがちらつかないように、カメラの動作を一貫させます(固定、ドリー、ゆっくりしたパン)。
- 小道具、照明、物理学に即興で追加する、モデルの衝動を制限します。
実際には、モーションコントロールはAfter Effectsのキーフレーミングというより、道路に車線を設定するようなものです。すべてのフレームの正確な座標は得られませんが、モデルが説明したものに近くとどまるように、パスを狭めることができます。

私を驚かせたこと:良いモーションコントロールは主に曖昧性の削減についてです。プロンプトが余地を残すと、モデルはそれを埋めます、通常カメラの動きで。カメラと背景について明示的な場合、被写体の動きはより予測可能になります。プロンプトの早い段階で「三脚、固定カメラ、ズームなし」と書いたとき、ドリフトは大幅に減りました。なくなったわけではありませんが、管理可能になりました。
あなたが制御できること/できないこと(パーツ、カメラ、ポーズ)
私が確実に制御できたこと
- カメラの規律。 「三脚ショット、固定カメラ、ズームなし、ドリーなし」と言うことは、他のどの行よりも役に立ちました。動きが必要な場合は、正確に1つ言います。「右から左へのゆっくりなパン、一定速度」です。複数の動きを混ぜると混乱していました。
- 粗い被写体の動き。 動詞と速度の言葉が機能します:「ゆっくり歩く」、「滑らかに滑る」、「90度回転」、「右手を肩の高さまで持ち上げて手を振る」。「優しく」などの副詞は「0.5 m/s」などの数字より良く解釈されました。
- アンカーの瞬間のポーズ。 時間スライスでポーズを説明する方がうまくいきました:「開始時:ニュートラルスタンス。中盤:右手が肩の高さまで持ち上がる。終了:手が下がる」。モデルはこれらをビートとして解釈しました。
すべりやすいままだったこと
- 細かい手足の軌跡。 「肘が45°」は通常、固くなりませんでした。「肘を丸めて密着」がうまくいきました。
- マイクロタイミング。 手を振るが正確に1秒で開始する必要がある場合、ドリフトを予想します。絶対秒ではなく、ビート(「中盤までに…」、「最後の3番目までに…」)を定着させることで、より近く到達しました。
- 物理的に完璧な衝突。 スライディングオブジェクトはときどき摩擦がないように感じました。表面の詳細を追加する(「粗いオークテーブルトップ、目に見える粒子」)のは少し役に立ちましたが、物理エンジンではありません。
ControlNetまたはMoCapの土地から来ている場合:Klingは、いくつかのラッパーでコンディショニング(ポーズ、マスク)を受け入れますが、プレーンテキストと慎重な負のものは、シンプルなショットの80%の方法で私を連れていました。
WaveSpeedセットアップ(モデル+プリセット)
Klingの上に座るいくつかのUIで「WaveSpeed」プリセットを見続けていました。ラッパー全体で名前は異なりますが、その考えは一貫していました:派手なカメラの動きより滑らかな速度曲線を支持します。現在のKlingビデオモデルをWaveSpeedスタイルのプリセットと組み合わせると、より安定した被写体の動きと少ないマイクロズームが得られました。
私のベースラインセットアップ:
- モデル: テスト時にダッシュボードで利用可能な最新のKlingビデオ/モーションモデル。
- プリセット: 「WaveSpeed」または安定したモーション、一定速度、または三脚のバイアスについて言及しているプリセット。
- モーション強調: 中。高いときは時々テクスチャの変化を過度に抑制しました:低いはカメラをさまよわせました。
あなたのUIに「WaveSpeed」がない場合、「スムーズな速度」、「一定のモーション」、または「カメラスタビライザー」のような切り替えを探します。異なる名前の下の同じ意図です。
このようなセットアップでは、独自のWaveSpeedを使用します。モーションを安定させ、プリセットを一貫させ、再試行を削減します。これは、チームがKling AI Motion Controlを処理する方法とまったく同じです。

ステップバイステップのワークフロー
最も再試行が少なかった道はここです。
-
ショットを言葉で枠に入れます
- カメラで始めます:「三脚、固定カメラ、ズームなし。」または1つの意図的な動きを名付けます。これを最初の文に入れます。
- 背景をロックします:「プレーンスタジオ背景」、「昼間の台所、静的」、「空の廊下、追加なし」。チャーンを減らします。
-
被写体とアイデンティティを説明します
- 2~3つのアンカーを持つ1つの明確な被写体アイデンティティ:衣類、カラーパレット、小道具。参照画像がある場合は、それを使用します。
-
モーションをビートで指定します
- 開始/中盤/終了。動詞と速度の言葉を使用します。同じビートで複数のアクションを混ぜることは避けてください。
-
モーションを保護する負のものを追加します
- 「カメラシェークなし、ズームなし、カットなし、タイムラプスなし、テレポートなし。」ばかげているように読みますが、機能します。
-
レンダリング前に期間とアスペクトを設定します
- 4~6秒でより厳密な制御が可能になりました。より長いクリップはドリフトに招待されました。
-
低解像度/高速パスを実行します
- あなたのUIがドラフトモードを許可する場合、最初に低解像度でモーションをテストしてください。この方法で問題の70%をキャッチしました。
-
小さな編集で反復します
- 実行ごとに1つの変数を変更します:カメラ、速度の単語、または1つのビート。大きなプロンプト編集は大きな予測不可能性を引き起こしました。
-
良いシードをロックします
- テイクが近い場合、シードをロックしてそこから押します。そうしないと、亡霊を追い続けることになります。
これは常に私に壁時計の時間を節約しませんでしたが、精神的負荷を減らしました。「何が変わった?」ふと少ないです。
プロンプト構造テンプレート

シンプルなスキャフォルドを使用して、空欄を埋めます。コピーして、微調整して、必要のないものは無視してください。
コンテキスト
- カメラ:[三脚/固定または1つの明確な動き]
- 背景:[短い静的説明]
- 期間:[X秒]、[アスペクト比]
被写体
- [誰/何]、[2~3のアイデンティティアンカー]
モーションビート
- 開始:[ポーズ/アクション]
- 中盤:[ポーズ/アクション]
- 終了:[ポーズ/アクション]
スタイルのヒント(オプション)
- [照明]、[テクスチャ詳細]、[リアリスティックか程式化されたか]
保護的な負のもの
- カメラシェークなし、ズームなし、カットなし、タイムラプスなし、モーションブラーの誇張なし、追加の文字なし
このフォーマットはKling AI Motion Controlをインプロパートナーより定常補助のように振る舞わせました。
5つのコピー貼り付けの例
短く、実用的で、テストされています。詳細を置き換え、骨を保ちます。
1. テーブル上の製品グライド(三脚)
カメラ:三脚、固定カメラ、ズームなし。背景:きれいなオークテーブルトップ、柔らかい日光。期間:5秒、16:9。
被写体:青いストライプ付きの白いセラミックマグ。
モーション:開始:マグが左、静止。中盤:マグが中央に滑り、一定速度。終了:マグが中央で停止、優しいイーズアウト。
スタイル:リアリスティック、微妙な反射、柔らかい影。
負のもの:カメラシェークなし、タイムラプスなし、チルトなし、追加小道具なし。
2. 人間の波、シンプルなタイミング
カメラ:三脚、固定、アイレベル。背景:プレーンスタジオグレー。期間:4秒、9:16。
被写体:緑色のフーディーを着た人、巻き毛、ニュートラルな表情。
モーション:開始:腕が下に。中盤:右手が肩の高さまで持ち上がり、2回小さな動きで手を振ります。終了:手が下がり、ニュートラルスタンス。
スタイル:柔らかいキーライト、自然な肌色。
負のもの:ズームなし、カットなし、バックグラウンドキャラなし、ヘッドターンなし。
3. 歩く被写体でのゆっくりなパン
カメラ:右から左へのゆっくりなパン、一定速度。背景:静かな街の歩道、早朝。期間:6秒、16:9。
被写体:赤いバックパック、デニムジャケットを着た大人。
モーション:開始:被写体がフレームの右から入り、ゆっくり歩きます。中盤:一定の歩き、目を前に。終了:パンが終わるとフレーム左から出ます。
スタイル:根拠のあるリアリズム、穏やかなコントラスト。
負のもの:ジャンプカットなし、レンズの呼吸なし、実行なし。
4. デスク上のハンドデモ
カメラ:トップダウン、固定カメラ、ズームなし。背景:カッティングマット付きの木製デスク。期間:5秒、1:1。
被写体:黒いペンを置く右手。
モーション:開始:空のデスク。中盤:手が下から入り、ペンを置き、90°回転します。終了:手が出ます、ペンが残ります。
スタイル:パリッとした、最小限の影、明確なエッジ。
負のもの:追加ツールなし、ジッターなし、色シフトなし。
5. ロゴカードプル
カメラ:三脚、固定、クローズアップ。背景:ニュートラルなペーパー背景。期間:4秒、4:5。
被写体:[あなたのロゴ]付きの小さなカード。
モーション:開始:カードフレーム外の下。中盤:カードが中央にスライドアップして保持します。終了:わずかな落ち着き、バウンスなし。
スタイル:きれい、リアルなテクスチャ、マクロフィール。
負のもの:視差なし、カメラプッシュインなし、追加テキストなし。
一般的な失敗+修正

-
カメラクリープ(マイクロズームまたは小さなチルト)
修正:最初の行に「三脚、固定カメラ、ズームなし」を入れます。完全なロックが必要な場合は、「ドリーなし、パンなし」を追加します。存続する場合は、期間を短縮するか、背景を単純化します。 -
モーションが浮きすぎている
修正:「一定速度」、「優しいイーズアウト」を使用するか、摩擦のある表面を名付けます(「粗いリネン、グリッピーゴムマット」)。時々、WaveSpeedのようなプリセットに切り替えるのが役に立ちました。 -
フレーム全体のアイデンティティドリフト
修正:強いアイデンティティアンカー(特定の衣類、色)、または参照画像を使用します。それに近い場合、シードをロックします。反復の中盤に新しい小道具を追加することは避けてください。 -
背景ジッター
修正:背景の詳細が少ないです。「プレーンウォール」は「動く人がいるカフェ」を打ちます。活発な背景が必要な場合、いくつかのモーション分散を受け入れるか、クリップを短縮します。
最適なエクスポート設定
クリップをエディター(Premiere、Resolve、FCP)に移動している場合、きれいなエクスポートは多くの再エンコーディングを節約します。
- 期間: 最初のパスを短くしておきます(4~6秒)。後で縫います。
- 解像度: ターゲット配信にて生成するか、その近くで。事後のアップスケーリングはうまくいきますが、ダブルスケーリングは避けてください。
- フレームレート: 映画のような感じで24 fps、製品/UIデモで30 fps、60は本当に必要な場合のみ。数字より一貫性がより重要です。
- コーデック/コンテナ: 編集用ProRes 422 HQまたはDNxHR;クイック共有用H.264 High Profile。ツールがH.264を強制する場合、バンディングを避けるためにより高いビットレートを設定します(例えば、1080pで15~20 Mbps、4Kで35~50 Mbps)。
- カラー: あなたの色空間をロックします。UIがsRGB/Rec.709を提供する場合、1つを選んでパイプライン全体で保ち続けます。
また、ファイル名またはサイドカーテキストに元のシードとプロンプトを保ちます。6回のレンダリング後、過去のあなたに感謝します。
さあ、これで完了です。1つの勝手なカップと多すぎるコーヒーで興奮した夜から抽出された、私の困難で得たKling AI Motion Control知恵です。今度はあなたの番です:Klingがあなたのクリップに追加した最も奇妙な「フレア」は何ですか?下記で返信してください!





