← 部落格

WaveSpeedAI LTX 2 Video Extend現已登陸WaveSpeedAI

LTX Video 2.0 透過在影片開頭或結尾生成新內容來延伸現有影片。支援提示詞引導延伸,最長可達 20 秒。即用型 REST 推論介面。

2 min read
Wavespeed Ai Ltx.2 Video Extend
Wavespeed Ai Ltx.2 Video Extend LTX Video 2.0 透過在影片開頭或結尾生成新內容來延伸現有影片。支援提示詞引導延伸,最長可達 20 秒。即用型...
Try it
WaveSpeedAI LTX 2 Video Extend現已登陸WaveSpeedAI

突破影片邊界:LTX-2 Video Extend 正式登陸 WaveSpeedAI

精彩的畫面往往不夠長。一個令人屏息的無人機鏡頭在音樂節點到來前兩秒就結束了。一段產品示範片段比付費社群廣告的最低長度要求還短。某個無法重拍的場景建立鏡頭需要再多撐幾個節拍。過去,解決方案不是代價高昂——追加拍攝時間、更多工作人員、更多後製——就是令人不滿意,例如尷尬的變速和定格畫面。LTX-2 Video Extend 現已在 WaveSpeedAI 上線,讓創作者和開發者能夠透過提示詞引導的 AI 生成技術,無縫延伸現有影片片段最多 20 秒。

什麼是 LTX-2 Video Extend?

LTX-2 Video Extend 建構於 Lightricks 備受讚譽的 LTX-2 基礎模型之上,這是首個能夠以原生 4K 解析度生成同步音訊與影片的開源 AI 影片模型。由 Lightricks 原創發布,並迅速獲得業界認可,成為市場上表現最優異的影片生成模型之一——上市時即獲得 Artificial Analysis 評為圖片轉影片第 3 名、文字轉影片第 4 名——LTX-2 架構將其在動作連貫性、視覺保真度和時間穩定性方面的優勢,帶入影片延伸這一特定挑戰中。

與會產生明顯瑕疵和重複動作的簡單幀插值或循環技術不同,LTX-2 Video Extend 能生成真正全新的影片幀,延續原始素材的動作動態、光照條件、鏡頭軌跡和場景構圖。最終呈現的是一段看起來和感覺上都像是單一連續拍攝的延伸片段。

LTX-2 模型採用基於 DiT(擴散 Transformer)的架構,擁有 140 億參數的影片串流,賦予其在延伸序列中理解和重現複雜視覺模式的卓越能力。正是這種架構深度,使模型能夠在從原始素材到生成素材的轉換過程中,維持精細細節——布料紋理、水流動作、面部表情。

核心功能

  • 最長延伸 20 秒 — 目前影片延伸模型中最長的延伸範圍,讓您靈活選擇添加短暫的 1 秒過渡或完整的 20 秒續拍。

  • 提示詞引導延伸 — 精確描述影片的演進方式。透過自然語言提示詞指揮鏡頭運動、角色動作、環境變化和情緒轉換,實現精準的創作掌控。

  • 無縫幀生成 — 生成的幀延續原始影片的動作、光照和視覺風格,原始素材與延伸素材之間無可見接縫、跳躍或閃爍。

  • 雙向延伸 — 可在影片開頭或結尾進行延伸,讓您在關鍵時刻之前添加引入畫面,或在場景原始結束點之後繼續延伸。

  • 內建提示詞增強器 — 可選工具,自動優化您的續拍描述,即使提示詞簡短或籠統也能獲得更好的結果。

  • 簡單的按秒計費 — 透明定價,每秒 $0.10,延伸 5 秒費用為 $0.50,完整 20 秒延伸費用為 $2.00,無隱藏費用。

實際應用場景

電影與影片製作

製作團隊可以延伸 B-roll 素材、場景建立鏡頭和過渡場景,無需安排額外的拍攝日。3 秒的航拍鏡頭可變成 15 秒的場景鋪陳,完美配合旁白時間。導演可以延伸反應鏡頭、拉長戲劇性停頓,或在台詞節拍之間增加呼吸空間——一切都無需重新召集演員和工作人員的高昂成本。

社群媒體內容創作

每個平台都有各自理想的影片長度。TikTok、Instagram Reels、YouTube Shorts 和 LinkedIn 在不同時長下表現各有不同。與其針對同一內容拍攝多個版本,不如將單一主片段延伸至各平台的最佳長度。內容創作者可以將一個簡短有力的 3 秒片段轉化為完整的 15 秒作品,給予觀眾更多互動時間。

電商與產品行銷

過短的產品示範影片讓潛在客戶沒有足夠資訊來完成轉換。延伸產品展示、開箱序列和功能示範,讓觀眾看到完整畫面。從單一原始片段創建多種廣告長度的版本——6 秒插播廣告、15 秒前貼片廣告和 30 秒展示廣告。

創意與實驗性專案

透過提示詞引導超越原始拍攝內容的延伸,將捕捉到的瞬間推向全新方向。引導縮時日落進入黑夜,延續動作場景至其後果,或探索替代的場景發展。LTX-2 Video Extend 將「接下來會發生什麼?」從一個剪輯問題變成一個生成工具。

數位看板與環境展示

將氛圍素材——城市景觀、自然場景、流水——延伸成更長的循環,用於零售展示、活動背景或直播疊加。連貫的幀生成確保循環自然融合,不出現明顯的重複點。

在 WaveSpeedAI 上快速入門

在 WaveSpeedAI 上使用 LTX-2 Video Extend 只需幾個步驟:

  1. 上傳原始影片 — 提供您想要延伸的片段
  2. 撰寫提示詞(可選) — 描述影片應如何繼續:鏡頭運動、動作、場景演變
  3. 設定時長 — 選擇延伸秒數,從 1 秒到 20 秒
  4. 啟用提示詞增強器(可選) — 讓內建工具優化您的描述
  5. 生成 — 提交並下載您的延伸影片

對於開發者,WaveSpeed API 讓整合變得簡單直接:

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/ltx-2/video-extend",
    {
        "video": "https://example.com/your-clip.mp4",
        "prompt": "The camera continues tracking forward through the forest as sunlight filters through the canopy",
        "duration": 10,
    },
)

print(output["outputs"][0])

定價

LTX-2 Video Extend 採用簡單的按秒計費,無最低消費或訂閱要求:

時長費用
1 秒$0.10
5 秒$0.50
10 秒$1.00
20 秒$2.00

最佳使用技巧

  • 提示詞要具體 — 描述鏡頭運動方向、主體動作和環境變化,而非抽象概念
  • 加入動作提示 — 說明現有動作應如何延續:「鳥兒繼續從左向右飛翔」、「汽車在轉彎時加速」
  • 先短後長 — 在投入完整 20 秒生成之前,先用 1-3 秒的延伸測試您的提示詞
  • 使用清晰的原始素材 — 具有明確動作方向和一致光照的影片能產生最連貫的延伸效果

為什麼選擇 WaveSpeedAI?

在 WaveSpeedAI 上運行 LTX-2 Video Extend,無需自行托管 140 億參數模型的開銷,即可獲得生產就緒的基礎設施:

  • 無冷啟動 — 為時間敏感的製作工作流程提供穩定、快速的響應時間
  • 優化推理 — 專為影片生成工作負載打造的基礎設施,比本地硬體更快速地交付結果
  • 即用型 REST API — 以最少的工作量整合至您現有的工作流程
  • 實惠透明的定價 — 按需付費,每秒 $0.10,無訂閱費或隱藏費用

立即開始延伸您的影片

LTX-2 Video Extend 將最強大的開源影片基礎模型之一的能力,帶入這一具體而實用的任務——智慧、無縫、經濟地讓您的影片更長。無論您需要多兩秒來達到平台要求,還是需要二十秒的新素材來完成敘事弧線,該模型都能在您的創意方向引導下,交付連貫的高品質延伸內容。

在 WaveSpeedAI 上試用 LTX-2 Video Extend,將您的短片段轉化為完整的故事。