← ブログ

Kuaishou Kling V3.0 Std Motion ControlがWaveSpeedAIに登場

Kling 3.0 Standard Motion Controlは、参照動画からモーションを転送して静止画像をアニメーション化します。キャラクター画像とモーションクリップ(ダンス、アクション、ジェスチャーなど)をアップロードしてください

By WaveSpeedAI 2 min read
Kwaivgi Kling V3.0 Std Motion Control Kling 3.0 Standard Motion Controlは、参照動画からモーションを転送して静止画像をアニメー...
Try it

Kling 3.0 Standard モーションコントロール:キャラクター画像に任意のモーションを転送する

Kling 3.0 Standard モーションコントロールは、AIビデオ生成における最も難しい問題の一つを解決します。それは、特定のキャラクターに特定のアクションを精密なコントロールで実行させることです。テキストプロンプトに悩み、モデルが意図を正しく解釈してくれることを願う代わりに、このビデオ対ビデオモデルではキャラクター画像と参照モーションクリップをアップロードするだけで、そのモーションをキャラクターに直接転送し、アイデンティティを保持したスムーズでリアルなアニメーションを生成できます。

クリエイター、マーケター、そしてAIビデオパイプラインを構築する開発者にとって、このモーション駆動型生成は、純粋なテキスト対ビデオモデルでは実現できないワークフローを解放します。正確なコレオグラフィー、再現可能な結果、そしてすべてのフレームでモデルに忠実なキャラクターを手に入れることができます。

WaveSpeedAIでKling 3.0 Standard モーションコントロールを試す →

Kling 3.0 Standard モーションコントロールの仕組み

Kling 3.0 Standard モーションコントロールは、KuaishouのKlingチームによるビデオ対ビデオモデルで、静止したキャラクター画像とドライビングビデオクリップの2つの入力間でモーション転送を行います。モデルは参照ビデオの動き、ジェスチャー、タイミングを解析し、顔のアイデンティティ、服装の詳細、全体的なビジュアルスタイルを保持しながら、キャラクターが同じモーションを実行するようにレンダリングします。

このモデルは、出力の構成を変える2つのオリエンテーションモードに対応しています:

  • Image オリエンテーション — 出力はキャラクター画像のフレーミングとポーズ参照に従います。ドライビングビデオの最大長は10秒です。
  • Video オリエンテーション — 出力はドライビングビデオのパースペクティブとフレーミングに従います。ドライビングビデオの最大長は30秒です。

開発者が注目する入出力:

  • 入力:キャラクター参照画像、ドライビングビデオ(URLまたはアップロードファイル)、character_orientationimageまたはvideo)、オプションのprompt、オプションのnegative_promptkeep_original_soundフラグ。
  • 出力:モーション転送されたMP4ビデオ(オプションでオリジナルの音声トラックを保持)。
  • 時間制限:imageモードで最大10秒、videoモードで最大30秒、最低3秒の課金ウィンドウ。

このモデルはWaveSpeedAI上でホスト型RESTインフェレンスAPIとして動作するため、GPUのプロビジョニングも、コールドスタートの待機も、モデルウェイトの管理も必要ありません。

Kling 3.0 Standard モーションコントロールの主な機能

  • 精密なモーション転送 — 実際の参照クリップから抽出された動きで任意のキャラクター画像を駆動し、テキストでモーションを説明する試行錯誤を排除します。
  • キャラクターアイデンティティの保持 — すべてのフレームにわたってキャラクターの顔、服装、ビジュアルシグネチャを維持するため、1枚の参照画像が再利用可能なパフォーマーになります。
  • 柔軟なオリエンテーションコントロール — 出力が画像のフレーミングに従うか、ビデオのフレーミングに従うかを選択でき、構図と最大時間をコントロールできます。
  • ネイティブオーディオパススルー — ドライビングビデオのオリジナル音声をオプションで保持でき、ダンスカバー、リップシンク作業、モーションとサウンドが密接に連動するシーンに最適です。
  • プロンプトガイド改良 — オプションのテキストプロンプトとネガティブプロンプトを追加して、再トレーニングなしでスタイル、ライティングを微調整したり、不要なアーティファクトを除去したりできます。
  • 組み込みプロンプトエンハンサー — 短い説明を自動的にモデルフレンドリーなガイダンスに展開し、より良い結果を生成します。
  • 最大30秒の出力 — ほとんどの競合モーションモデルがサポートするよりも長い単一クリップビデオを生成できます。

Kling 3.0 Standard モーションコントロールの最適なユースケース

インディー映画とショート用キャラクターアニメーション

インディー映画製作者やアニメーターは、スマートフォンで素早い参照パフォーマンスを撮影し、そのパフォーマンスを完全にデザインされたキャラクター(オリジナルIP、マスコット、またはスタイライズドアバター)に転送できます。キャラクター画像は複数のショットにわたって一貫性を保ちますが、これは従来のAIビデオパイプラインが最も苦手としている部分です。

バーチャルプレゼンターとトーキングアバター

バーチャルホスト、AIチューター、またはブランドアバターを構築するブランドは、スクリプトを配信する人間のプレゼンターを1回録画し、そのパフォーマンスをカスタムキャラクター画像に適用できます。keep_original_soundを有効にすると、アバターは参照音声で話し、製品デモ、コースコンテンツ、またはソーシャル解説動画に対応できます。

スケールでのダンスビデオと音楽コンテンツ

コレオグラファー、ダンススタジオ、音楽マーケターは、1つの参照ダンスクリップを取り、異なる衣装、アートスタイル、またはブランドキャラクターなど、数十のキャラクターバリアントにリミックスできます。これはTikTokとReelsで最も高いエンゲージメントフォーマットの一つであり、モーションコントロールはそれを再現可能な制作ラインに変えます。

ゲームキャラクターとマスコットアニメーション

ゲームスタジオとブランドチームは、3Dリグを構築せずに静的なキャラクターアート、NPC、またはマスコットをアニメートできます。コンセプトアートと参照モーションクリップ(手を振る、お辞儀をする、戦闘スタンス、アイドルループ)をアップロードするだけで、トレーラー、ソーシャル投稿、またはゲーム内シネマティクスに使用可能なアニメーションが得られます。

Eコマース製品ストーリーテリング

ファッションとライフスタイルブランドは、参照ウォーク、ターン、または製品インタラクションを使用して、スタイルされたモデル画像をモーションに乗せることができます。これにより、ルックブックのキャラクターをオンモデルに保ちながら、撮影をスケジュールすることなく、製品ページと広告のヒーロービデオが生成されます。

教育とトレーニングコンテンツ

トレーニングチームは、実際の人物がアクションを行うのを録画することで、イラストインストラクターや歴史的人物が特定のジェスチャー(指さし、デモンストレーション、サイン)を実行するようにアニメートできます。結果は静的なスライドよりも魅力的で、フルモーションキャプチャ制作のコストなしに実現できます。

広告クリエイティブの迅速なプロトタイピング

UGCスタイル広告を反復するパフォーマンスマーケターは、1つの参照クリップで駆動しながら、異なるキャラクタールック、デモグラフィック、またはアートスタイルで同じモーションをA/Bテストできます。より速い反復はクリエイティブテストの速度とCPAを直接改善します。

最初のモーションコントロールビデオを生成する →

Kling 3.0 Standard モーションコントロールの料金とAPIアクセス

料金は時間ベースで、最低3秒から、5秒あたり$0.63で線形にスケーリングします:

時間コスト
≤ 3秒$0.378
5秒$0.63
10秒$1.26
20秒$2.52
30秒(最大)$3.78

月額最低料金なし、アイドルGPU料金なしの透明な従量課金制です。

API呼び出し例

import wavespeed

output = wavespeed.run(
    "kwaivgi/kling-v3.0-std/motion-control",
    {
        "image": "https://example.com/character.png",
        "video": "https://example.com/dance-reference.mp4",
        "character_orientation": "video",
        "prompt": "smooth cinematic motion, soft studio lighting",
        "keep_original_sound": True,
    },
)

print(output["outputs"][0])

開発者が知っておくべきWaveSpeedAIの利点:

  • コールドスタートなし — すべてのリクエストで即座にインフェレンスが開始されます。
  • 従量課金 — 出力時間のみに課金されます。
  • REST API — 言語非依存で、あらゆるスタックで動作します。
  • プロダクション対応 — 同じエンドポイントがプロトタイプから大量トラフィックパイプラインまでスケールします。

Kling 3.0 Standard モーションコントロールで最良の結果を得るためのヒント

  • クリアで正面向きのキャラクター画像を使用する — 顔が見える明るい参照画像が、フレーム全体で最も強いアイデンティティ保持を実現します。
  • クリーンで視認性の高いモーションのドライビングビデオを選ぶ — 最小限のオクルージョンによる全身または上半身のフレーミングが最も正確な転送を生みます。
  • 目標に合わせてオリエンテーションを選択する — キャラクターのポーズを参照画像に固定する場合はimageオリエンテーションを選択し、最大30秒の長いクリップにはvideoオリエンテーションを選択します。
  • 音声とモーションを同期させる必要がある場合(ダンス、スピーチ、パフォーマンス)はkeep_original_soundを有効にする。
  • negative_promptを使用して繰り返し発生するアーティファクトを抑制する — 例:「blurry face, distorted hands, extra limbs」。
  • 30秒の実行前に5秒のテストを実施する — コストの低い反復サイクルで、より速いプロンプト改良が可能です。

より高度なキャラクターワークフローには、このモデルを高品質のKling V3.0 Pro モーションコントロールと組み合わせるか、WaveSpeedAI画像生成コレクションのモデルでベース画像を生成してください。

FAQ

Kling 3.0 Standard モーションコントロールとは何ですか?

Kling 3.0 Standard モーションコントロールは、参照ビデオから静止したキャラクター画像にモーションを転送するビデオ対ビデオAIモデルです。キャラクターがオリジナルのアイデンティティを保持しながら参照の動きを実行するアニメーションビデオを生成します。

Kling 3.0 Standard モーションコントロールの料金はいくらですか?

料金は最大3秒のクリップで$0.378から始まり、5秒あたり$0.63でスケーリングし、30秒の最大値で$3.78が上限です。課金は最低料金なしの従量課金制です。

APIでKling 3.0 Standard モーションコントロールを使用できますか?

はい。このモデルはWaveSpeedAI上でRESTインフェレンスAPIとして利用可能で、コールドスタートなし、言語非依存の統合、ローカルプロトタイピングから本番トラフィックまでスケールする同一エンドポイントを提供します。

出力ビデオの最大長はどのくらいですか?

character_orientationimageの場合は最大10秒、character_orientationvideoの場合は最大30秒です。最低課金時間は3秒です。

Kling 3.0 Standard モーションコントロールはオリジナルの音声を保持しますか?

はい — keep_original_soundが有効(デフォルト)の場合、ドライビングビデオのオリジナル音声トラックが出力に保持されます。これはダンス、音楽、ダイアログ主導のシーンに最適です。

Kling 3.0 Standard モーションコントロールで構築を始める

モーションを説明するためにテキストプロンプトと格闘するのはやめましょう。キャラクターをアップロードし、参照クリップをアップロードして、オンモデルのアニメーションビデオをリリースしましょう。

WaveSpeedAIでKling 3.0 Standard モーションコントロールを起動する →