LTX-2.3 縦型動画ガイド:ソーシャル&モバイル向け9:16ワークフロー(2026年)
LTX-2.3はトリミング不要で9:16縦型動画を最大1080×1920のネイティブ解像度で生成できます。2026年に向けて、ソーシャルメディア対応の縦型クリップを設定・プロンプト作成・バッチ生成する方法を解説します。
こんにちは、Doraです!
ポートレートを後付けではなく、ファーストクラスのフォーマットとして扱う動画モデルをずっと待っていました。ほとんどのツールは横向きで生成してクロップさせるだけです。LTX-2.3 はそれを変えました — 横向きからクロップするのではなく、ポートレート向けのデータで学習した上で、最大1080×1920の縦向き動画を生成します。TikTokやReelsのワークフローを運用するソーシャルチームにとって、この違いは聞こえる以上に重要です。

ネイティブポートレートサポートが重要な理由(クロップとの違い)
「ポートレートデータで学習」が出力品質に意味すること
モデルが16:9で生成したものを9:16にクロップすると、縦向き構図で考えられていません。被写体が中央からずれ、空が下三分の一を占め、スマートフォン画面上でモーションの動きが不自然に感じられます。
LTX-2.3はオープンソースモデルとしても、LTX APIを通じても利用可能で、ポートレートサポートは後付けではなくトレーニングパイプラインに組み込まれています。モデルはトレーニング中に縦向き優先の構図を学習しており、被写体の配置、モーションの弧、カメラの動きがすべて縦長フレームでの視聴に最適化されています。
9:16ポートレートサポートは縦向きポートレート動画の品質を大幅に向上させ、ソーシャルメディアやモバイルに最適です。これはマーケティング用語ではなく、モデルの重みがアスペクト比固有の空間的関係をどのように処理するかという構造的な違いです。
9:16の解像度とフレームレート設定
ComfyUIおよびAPIでの1080×1920設定
9:16の実用的なデフォルトは720p(736×1280)です。RTX 5090以上の高性能GPUをお持ちの場合は、フル1080p品質のために1088×1920をお試しください。
公式LTXVideoノードを使用したComfyUIでは、24GBカードでVRAMと品質のバランスを取るために解像度ノードを768×1280に設定します。APIユーザーの場合、LTX APIドキュメントでは解像度パラメーターとともにaspect_ratio: "9:16"を受け付けています — 手動での寸法計算が必要です。

API経由(最小構成):
model: ltx-2-3-pro
resolution: 1080p
aspect_ratio: 9:16
fps: 24
ソーシャルプラットフォーム向け24fps vs 48fps: どちらを使うべきか
LTX-2.3では、既存の25/50 FPSに加えて24/48 FPSが新たなフレームレートオプションとして導入されました。
ソーシャル向けには、ほとんどのコンテンツに24fpsを使用してください。TikTokとReelsはどちらもアップロード時にトランスコードを行い、24fpsはファイルサイズを膨らませずに最大のヘッドルームを確保できます。48fpsで一度エンコードして後でダウンコンバートすると、ポスト処理での柔軟性が最大になります。48fpsは、モーションの滑らかさが売りになるコンテンツ(ダンス、製品発表、スローモーションエミュレーション)に使用してください。
縦向き構図のためのプロンプト
縦向き優先のフレーミング言語
モデルはフレーミング言語に反応します。ポートレート出力には、被写体を説明する前に向きの手がかりを先頭に置いてください:
- ✅
vertical frame, close-up portrait, subject centered in upper half... - ✅
phone-screen composition, full-body vertical shot, negative space below... - ❌
wide establishing shot, panoramic landscape...(横向き構図に引っ張られます)
被写体の配置と横向きバイアス出力の回避
ネイティブポートレートトレーニングがあっても、広いシーンの言語でプロンプトすると、モデルが横向き構図に流れることがあります。被写体が縦向き上部ではなく中央広角に流れ続ける場合は、tall frame、vertical negative space、portrait orientation, face in upper thirdなどの明示的な縦向きアンカーを追加してください。
トーキングヘッドやアバターコンテンツの場合、WaveSpeedのLTX-2.3実装では、縦軸に対してモーションを説明するとポートレートクリップが最もよく機能すると記されています — カメラのチルト、縦方向のパン、ライジングショットはすべて縦長フレームを強化します。

ポートレートワークフローでのオーディオ: 含めるものと省くもの
ネイティブオーディオがソーシャルで価値を発揮する場面(環境音、音声オンコンテンツ)
効果音、環境音、ダイアログは生成から同期されています — 専用のオーディオ対ビデオエンドポイントで音声クリップを提供し、マッチするビジュアルを生成できます。
ネイティブオーディオを使用する場面: コンテンツが音声オン(環境シーン、自然のクリップ、群衆のエネルギー)の場合。LTX-2.3のオーディオ改善により、後処理なしで雰囲気のある音がそのまま使用可能になっています — アーティファクトの低減、クリーンなダイアログ。
ポスト処理でオーディオを追加する場合
ナレーション主導のコンテンツ、音楽シンク、ブランドサウンド、または正確なオーディオ編集が必要なものにはネイティブオーディオをスキップしてください。ビデオのみを生成し、NLEでオーディオをレイヤー追加します。Proバリアントはオーディオ対ビデオ、リテイク、拡張エンドポイントに必要です — ポスト処理で追加する音楽トラック用にビデオのみを生成する場合、Fastバリアントはコストと時間を節約できます。
ソーシャルチームのバッチ制作ワークフロー
大量出力向けストーリーボードからクリップへのパイプライン
1日20本以上のクリップを生成するチームの実践的なパイプライン:
- スクリプト → ストーリーボード — ショットごとにポートレート固有のフレーミングノートを付ける
- バッチプロンプト — LTX API経由 — APIはステートレスなので並列リクエストは独立して実行される
- QCパス — 被写体のドリフトや横向きバイアス出力を再生成用にフラグを立てる
- オーディオレイヤー — 音楽主導の場合はポスト処理で
ドラフトにFastバリアント、最終版にProバリアント
Fastで構図を素早く探索し、最終レンダリングにProに切り替えます。Fastはスピードと低コストに最適化されており、ラピッドプロトタイピング、ブレインストーミング、ストーリーボード作成、素早いイテレーションに最適です。Proはよりよいモーションスタビリティとビジュアルディテールでより高い忠実度を提供します。
典型的なバッチコストパターン: 10本のFastドラフトで構図とタイミングを固め、その後1本のProレンダリングで納品。これによりProを全体で使用する場合と比べてイテレーションコストを約60%削減できます。
再生成なしで長いシーケンスを延長するExtend-Video
v1/extendエンドポイントは追加フレームを生成してビデオ時間を延長します。8〜10秒以上のポートレートシーケンスには、再生成ではなく延長を使用してください — 延長されたクリップ全体で被写体の一貫性が保たれます。最もスムーズなつなぎのために、クリップの末尾から2〜3秒のコンテキストウィンドウを設定してください。
制限事項とよくある失敗
長い縦向きクリップでの被写体ドリフト
12〜15秒を超えると、ポートレートクリップで被写体ドリフトが発生する可能性があります — モデルが徐々に被写体の位置を中央フレームに向けてシフトします。対策: 16秒の1回の生成ではなく、Extend-Videoを短いセグメント(8秒 + 8秒)で使用してください。
クロップ・リファインした横向きがネイティブポートレートに勝る場合
ネイティブポートレートが常に正しい選択とは限りません。ワイドアクションコンテンツ(スポーツ、群衆シーン、車両ショット)には、横向き生成後にスマートクロップする方がよりよい横向き構図と自然なモーションを生み出します。モデルは16:9や21:9などのワイドスクリーンアスペクト比で最もよく機能します — ポートレートフォーマットは一部のコンテンツタイプで歪んだ結果を生む可能性があります。すべてのコンテンツタイプにポートレートを採用する前に、両方のアプローチをテストしてください。
ComfyUI-LTXVideo GitHubリポジトリには両方のパスのリファレンスワークフローが含まれており、ノードをゼロから構築せずに並べて比較するのに便利です。

よくある質問
Q1: LTX-2.3ポートレート出力の最大解像度は?
LTX-2.3はテキスト対ビデオ、画像対ビデオ、オーディオ対ビデオ生成を最大1080pでサポートし、ネイティブポートレート(9:16)動画も含まれます。実際には、1080×1920がポートレートの上限です。ほとんどのソーシャルワークフローでは720p(736×1280)が実用的なデフォルトです — より速く、コストが低く、プラットフォームもどうせトランスコードします。
Q2: ポートレートモードには横向きとは異なるLoRAが必要ですか?
いいえ。LTX-2.3はLoRAファインチューニングをサポートしており、特定のスタイル、キャラクター、またはユースケース向けにモデルをカスタマイズできます。横向きデータで学習したLoRAは一般的にポートレート生成に転用できます — フレーミングの動作はLoRAの重みではなく、プロンプトと解像度設定によって制御されます。ただし、ポートレート固有のデータで学習したLoRAはより一貫した縦向き構図を生み出します。
Q3: LTX-2.3のポートレート品質はソーシャルコンテンツでKlingと比べてどうですか?
直接ベンチマークはコンテンツタイプによって異なります。LTX-2.3の優位性はオープンウェイト、APIアクセス、ネイティブポートレートトレーニングにあります — Klingはクラウドのみで、トレーニングデータの透明性が低いです。環境・シーン主導のポートレートコンテンツでは、LTX-2.3は1080pで競争力があります。高度にスタイル化された人物被写体には、Klingのクローズドモデルが一部のカテゴリでまだ優位性を持っています。決定する前に特定のコンテンツタイプでテストしてください。
Q4: APIでポートレートクリップをバッチ生成できますか?
はい。LTX APIはあらゆるボリュームで予測可能なパフォーマンスを持つ実際のワークロード向けに設計されており、安定した出力、一貫した忠実度、インフラグレードの信頼性を提供します。ポートレートと横向きのリクエストは同じエンドポイントを使用します。リクエストボディにaspect_ratio: "9:16"を追加してください。現在のパラメーター仕様についてはLTX APIの変更履歴をご確認ください。
Q5: LTXデスクトップアプリはポートレート生成をサポートしていますか?
LTX Desktopは、オープンウェイトでクラウド依存なしにローカルハードウェア上で動作するLTX-2.3エンジン上に構築されたフルビデオエディターです。ポートレート生成はサポートされています — 出力設定で解像度を9:16比率に設定してください。1080pポートレートレンダリングでローカルVRAMが制約となる場合、fal.ai LTX-2.3プラットフォームがサーバーレスの代替を提供しています。

まとめ
LTX-2.3のネイティブポートレートサポートは、クロップの回避策ではなく、本物のトレーニングレベルの変更です。ソーシャルチームにとって、これは出力段階でのより良い被写体配置、より自然なモーション、より少ない構図修正を意味します。
実践的なルールはシンプルです: ほとんどの納品に720p、ドラフトにFast、最終版にPro、12秒以上のものにはExtendを使用してください。ワイドアクションコンテンツには横向きからクロップが依然として優ります — ショットに適したツールを使用してください。
今構築するパイプラインは将来に引き継がれます。ワークフローを正しく設定すれば、品質の向上は自然についてきます。
過去の投稿:





