← ブログ

LTX 2.3 Video ExtendがWaveSpeedAIに登場

LTX-2.3は、DiTベースの音声・映像基盤モデルで、単一モデル内で同期されたビデオと音声を生成するように設計されており、音声と映像の品質が向上しています。

1 min read
Wavespeed Ai Ltx.2.3 Video Extend
Wavespeed Ai Ltx.2.3 Video Extend LTX-2.3は、DiTベースの音声・映像基盤モデルで、単一モデル内で同期されたビデオと音声を生成するように設計されてお...
Try it
LTX 2.3 Video ExtendがWaveSpeedAIに登場

LTX-2.3 Video Extendで動画をシームレスに延長する

魅力的な動画コンテンツを作成するとき、クリップがほんの数秒足りないという状況はよくあります。ドローン映像が景色の全貌を映しきる前に終わってしまったり、製品デモがメッセージを伝えるためにもう少し尺が必要だったりすることがあるでしょう。これまで動画を延長するには、再撮影するか、使いにくい編集の回避策を使うか、唐突なカットで妥協するしかありませんでした。

LTX-2.3 Video Extendはそれをすべて変えます。WaveSpeedAIでご利用いただけるようになったこのモデルは、既存の映像を自然に続けるフレームを生成します。動き、スタイル、雰囲気をシームレスにマッチングさせるため、視聴者にはオリジナルがどこで終わり、拡張がどこから始まるのかわかりません。

LTX-2.3 Video Extendとは?

LTX-2.3 Video ExtendはLTX-2.3基盤モデル上に構築されており、高い時間的一貫性を持つ高品質な動画生成のために設計されたDiTベース(Diffusion Transformer)アーキテクチャを採用しています。LTX-2.3ファミリーにはテキストから動画、画像から動画への変換機能が含まれていますが、Video Extendバリアントは特定の非常に実用的なタスクに特化しています。既存の動画クリップを受け取り、コンテンツを自然に継続する新しいフレームを生成することです。

動画をアップロードし、追加で必要な秒数(1〜20秒)を指定し、オプションでシーンがどのように展開するかを説明するだけです。モデルはソース映像の動きのパターン、視覚的スタイル、ライティング、構図を分析し、最後のフレームから自然に流れる続きを生成します。

結果として得られる延長映像は元の動画のキャラクターを保持します。カメラの動きはその軌道を継続し、物体はその勢いを維持し、環境の詳細は一貫したままです。

主な機能

  • 時間的一貫性: モデルは単に妥当なフレームを生成するだけでなく、特定のソース動画の一貫した続きとなるフレームを生成します。動きの軌道、ライティングの変化、シーンのダイナミクスが自然に引き継がれます。

  • 柔軟な長さ制御: 1秒から最大20秒まで、1回の生成で動画を延長できます。この細かい制御により、リソースを無駄にすることなく必要なものだけを正確に追加できます。

  • オプションのプロンプトガイダンス: テキスト入力なしで動画を延長できますが、シーンの展開を説明するプロンプトを提供することもできます。カメラを左にパンさせたい?キャラクターに歩き始めさせたい?説明すれば、モデルがその指示を続きに組み込みます。

  • 組み込みプロンプトエンハンサー: 望む続きをどう説明すればいいかわからない場合でも大丈夫です。統合されたプロンプトエンハンサーが説明を自動的に改善し、より良い結果をもたらします。

  • WaveSpeedAIではコールドスタートなし: モデルは常にウォームアップ済みで準備完了です。インフラの起動を待つことなくリクエストを送信して結果を取得できます。これはクリエイティブなプロジェクトで反復作業を行い、素早いフィードバックループが必要な場合に重要です。

実際のユースケース

SNSとショートフォームコンテンツ

4秒の夕日のクリップは美しいですが、InstagramやTikTokではスクロールされてしまうには早すぎます。15秒に延長すれば、注目を引き付けるフルポストになります。コンテンツクリエイターは再撮影なしで、スマートフォンで撮影したわずかな瞬間を洗練されたフルレングスの動画に変換できます。

映像・動画制作

Bロールはプロ動画の基盤であり、いつも足りないものです。エスタブリッシングショット、風景映像、またはアンビエントクリップを延長して編集の隙間を埋めましょう。3秒のドローン空撮が、シーン全体のトランジションを担う20秒のシーケンスになります。

製品デモとマーケティング

製品動画はボイスオーバーや画面上のテキストと同期するために正確なタイミングが必要です。クリップが短い場合、数秒延長することで不自然な間やジャンプカットなしに視覚的な流れを維持できます。これはスムーズで連続した映像が購買意欲を高めるeコマースの製品展示で特に役立ちます。

ループ作成

動画の終わりと始まりの間をつなぐフレームを追加生成し、デジタルサイネージ、ウェブサイトの背景動画、またはアンビエントディスプレイのためのシームレスなループを作成できます。

ストーリーテリングとアニメーション

アニメーターやデジタルストーリーテラーは重要なシーンを延長し、瞬間に余白を与えることができます。キャラクターのリアクションショット、劇的な間、またはスローリビールは、追加の手作業フレームなしにナラティブに沿った形で引き延ばすことができます。

WaveSpeedAIで始める

WaveSpeed Python SDKを使えば、わずか数行のコードで始められます:

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/ltx-2.3/video-extend",
    {
        "video": "https://your-video-url.com/clip.mp4",
        "duration": 10,
        "prompt": "The camera continues to push forward through the forest as sunlight filters through the canopy"
    },
)

print(output["outputs"][0])

以上です。設定するインフラも、管理するGPUインスタンスも、コールドスタートの遅延もありません。動画とパラメータを提供すれば、WaveSpeedAIが残りを処理します。

料金

LTX-2.3 Video Extendは分かりやすい秒単位の課金を採用しています:

延長時間料金
1秒$0.10
5秒$0.50
10秒$1.00
20秒$2.00

1秒あたり$0.10なので、自由に実験できます。1秒延長でアプローチを検証し、方向性に満足したらより長い尺にスケールアップしましょう。

最良の結果を得るためのヒント

  • クリアなソース映像を用意する: 動きの方向が明確で一貫したライティングの動画は、モデルに最も強いシグナルを与えます。
  • 短く始めて、長くする: 20秒の生成にコミットする前に、2〜3秒の延長でテストしましょう。素早く安価に反復できます。
  • 説明的なプロンプトを使う: プロンプトはオプションですが、結果を大幅に改善します。カメラの動き、被写体の行動、環境の変化を説明しましょう。
  • 動きの軌道を考える: モデルは続ける方向が明確なとき(動くカメラ、歩く被写体、流れる水、流れる雲など)に最も力を発揮します。

クリエイティブな可能性を広げる

LTX-2.3 Video Extendは動画制作における最も根強い摩擦点の一つ、クリップの長さが固定されているという制約を取り除きます。スマートフォンの映像を洗練されたコンテンツに引き延ばすソロクリエイターであれ、精心撮影されたBロールを延長する制作チームであれ、このモデルは実験を現実的にする価格帯で自然で一貫した続きを提供します。

今すぐWaveSpeedAIでLTX-2.3 Video Extendを試す、短いクリップを本当に必要な映像に変えましょう。