LTX 2 19b ControlがWaveSpeedAIに登場

Wavespeed Ai Ltx.2 19b Control を無料で試す

LTX-2 19B ControlNetの紹介:ポーズ、深度、エッジガイダンスを使用した精密なビデオ間変換

AIビデオ生成の風景は新しいマイルストーンに到達しました。LTX-2 19B ControlNetはビデオ変換に構造的ガイダンスの力をもたらし、クリエイターがフッテージを魅力的にするモーションとダイナミクスを保持しながらビデオコンテンツを再形成することを可能にします。Lightricksの革新的な190億パラメータ拡散トランスフォーマーアーキテクチャに基づいて構築されたこのモデルは、制御されたビデオ生成における大きな飛躍を表しています。

LTX-2 19B ControlNetとは?

LTX-2 19B ControlNetは、ポーズ、深度、またはcannyエッジ検出を使用して、入力からのモーション構造を維持しながら新しいビデオコンテンツの生成をガイドするビデオ間変換モデルです。このモデルはLTX-2ファミリーと同じ強力な基盤で動作します。ビデオとオーディオトークンを同時に処理する48層の非対称デュアルストリーム拡散トランスフォーマーです。

このモデルを際立たせているのは、最大20秒の長さの同期されたオーディオビデオコンテンツを生成できることです。このアーキテクチャは190億パラメータを戦略的に分割します:ビデオ処理に約140億、オーディオに50億で、単一パスでコヒーレントなマルチモーダル出力を実現します。

ControlNet統合により、モデルがソースビデオをどのように解釈するかを正確に選択できます。ポーズ検出を通じて人間のモーションを保持したい場合、深度マッピングを通じてシーン構造を維持したい場合、またはcannyエッジ検出を通じて正確なエッジをフォローしたい場合でも、変換プロセスを完全に制御できます。

主な機能

すべてのユースケースのための3つのガイダンスモード

  • ポーズモード:入力ビデオから骨格とポーズ情報を抽出し、人間とキャラクターのモーション転送に理想的です。このモードはフレーム全体の体の位置を確実に追跡し、ダンスシーケンス、運動競技、または人間のモーションが焦点となるコンテンツに最適です。

  • 深度モード:ソースビデオから深度マップを作成して、シーン構造と空間関係を保持します。環境を変換したい場合、視覚スタイルを変更したい場合、またはフッテージの基本的なジオメトリを保持しながらクリエイティブエフェクトを適用したい場合に使用します。

  • Cannyエッジモード:ソース素材のエッジを検出して、形状と輪郭を保持しながら生成をガイドします。このモードは、正確な視覚的境界を維持する必要があるスタイル転送アプリケーションで優れています。

柔軟なオーディオ処理

モデルは、クリエイティブなニーズに合わせるための3つのオーディオモードを提供します:

  • 保持:入力ビデオから元のオーディオトラックを保持します。リップシンク シナリオに不可欠です
  • 生成:変換された映像に合わせて同期された新しいオーディオを作成します
  • なし:後で別途オーディオを追加するプロジェクト用のサイレントビデオを出力します

参照画像統合

参照画像をアップロードして、変換されたビデオの外観を定義します。モデルは参照の視覚的特性を適用し、入力ビデオがすべてのモーションを制御します。これにより、参照フッテージのモーションで任意のキャラクター画像にアニメーションを付けることができるキャラクター駆動変換が可能になります。

組み込みプロンプト強化

統合されたプロンプト強化機能は、テキスト説明を自動的に改善してより良い結果を得られます。キャラクターの感情、カメラの動き、照明の方向など、微妙な言語の手がかりを理解するGemma-3テキストエンコーダと組み合わせることで、この機能は広範なプロンプト・エンジニアリングなしにプロフェッショナルな結果を達成するのに役立ちます。

実世界のユースケース

キャラクターアニメーションとモーション転送

参照フッテージからのモーションを適用して、静止キャラクター画像を完全にアニメーション化されたビデオに変換します。イラストキャラクター、写真、またはデジタルアバターで作業している場合、ポーズガイダンスモードはモーションを正確にキャプチャし、参照画像が視覚的出力を定義します。

ソーシャルメディア用ダンス転送

ウイルス性ダンスムーブを被写体に転送することで、エンゲージングなコンテンツを作成します。ポーズモードはフレームごとに体の位置を追跡し、ダンスビデオをスタイル化されたアニメーションに変換することができます。TikTok、Instagram Reels、YouTube Shortsコンテンツに最適です。

ビデオスタイル転送

元のモーションを保持しながら、既存のフッテージに劇的な視覚的変換を適用します。深度モードを使用してビジュアルスタイルを変更する際にシーン構造を保持するか、または正確な形状保持が最も重要な場合はcannyエッジモードを使用します。

ビデオ制作での文字の一貫性

シリーズコンテンツまたはブランド化されたビデオで作業するクリエイターの場合、参照画像機能は複数のクリップ全体にわたって一貫したキャラクター外観を確保します。モーションはさまざまなソースビデオから取得できますが、キャラクター外観は統一されたままです。

リップシンクビデオ作成

元のオーディオを保持しながら被写体の視覚的外観を変換します。このワークフローは、ダブ済みコンテンツの作成、ライブフッテージのアニメーション版、またはプライバシーを保護するビデオ修正の作成に特に価値があります。

WaveSpeedAIでの開始

WaveSpeedAIでLTX-2 19B ControlNetを使用することは簡単です:

  1. ソースビデオをアップロードします — これは出力のモーション構造を提供します
  2. 参照画像を追加します(オプション) — 変換されたビデオで希望する外観を定義します
  3. プロンプトを作成します — 作成したいものを説明します
  4. コントロールモードを選択します — ニーズに基づいてポーズ、深度、またはcannyを選択します
  5. オーディオ処理を選択します — 元を保持、新規生成、またはなし
  6. 解像度を設定します — 480pで迅速な反復、720pでバランスの取れた品質、1080pで最終レンダリング用
  7. 生成 — 送信して変換されたビデオをダウンロードします
import wavespeed

output = wavespeed.run(
    "wavespeed-ai/ltx-2-19b/control",
    {
        "video": "https://example.com/source-video.mp4",
        "image": "https://example.com/reference.jpg",
        "prompt": "A person dancing in a futuristic neon city",
        "mode": "pose",
        "audio_mode": "generate",
        "resolution": "720p"
    },
)

print(output["outputs"][0])

価格設定

モデルは解像度に基づいた簡潔な1秒あたりの価格を提供します:

解像度5s10s15s20s
480p$0.15$0.30$0.45$0.60
720p$0.20$0.40$0.60$0.80
1080p$0.30$0.60$0.90$1.20

最良の結果のためのプロのヒント

  • 開始ポーズを一致させます:参照画像の被写体ポーズをソースビデオの開始ポーズに配置して、シームレスな結果を得られます
  • 適切なモードを選択します:人間/キャラクターモーション用にポーズを使用、シーン構造用に深度を使用、エッジベース精度用にcannyを使用します
  • 効率的に反復します:480pで開始してアプローチを洗練させ、720pまたは1080pで最終出力をレンダリングします
  • オーディオ戦略:リップシンクプロジェクト用にオーディオを保持、新規コンテンツ用に生成、またはポスト制作でオーディオを追加する場合はなしを使用します

WaveSpeedAIを選ぶ理由は?

WaveSpeedAIはLTX-2 19B ControlNetを実行するための理想的な環境を提供します:

  • コールドスタートなし:ジョブはインフラストラクチャの遅延なしに即座に処理を開始します
  • 最適化された推論:NVIDIAで最適化された展開により、可能な限り高速な生成時間が保証されます
  • 透明な価格設定:明確な1秒あたりの請求で生成したものだけに支払います
  • 本番対応API:アプリケーションとワークフローに直接統合します

今日から創作を開始します

LTX-2 19B ControlNetは、ビデオ変換の精密な制御が必要なビデオクリエイター、アニメーター、開発者に新しい可能性を開きます。ControlNetガイダンスモード、柔軟なオーディオ処理、および強力な19B DiTアーキテクチャの組み合わせは、アクセス可能な価格ポイントでプロフェッショナル品質の結果を提供します。

正確な構造ガイダンスでビデオを変換する準備ができていますか?WaveSpeedAIでLTX-2 19B ControlNetを試してくださいそして、AIビデオ生成を完全に制御できるときに何が可能かを発見してください。