LTX 2.3 Video Extend現已登陸WaveSpeedAI
LTX-2.3 是一個基於 DiT 架構的音視頻基礎模型,旨在單一模型中生成同步的視頻與音頻,並具備更出色的音頻與視覺品質。
使用 LTX-2.3 Video Extend 無縫延長您的影片
製作引人入勝的影片內容,往往意味著要處理那些只差幾秒鐘的片段。也許您的空拍鏡頭在景色完全展開之前就結束了,或者您的產品示範需要再多幾個節拍才能讓訊息完整傳達。在此之前,延長影片片段意味著要重新拍攝、使用笨拙的剪輯變通方案,或者接受突兀的剪切。
LTX-2.3 Video Extend 徹底改變了這一切。現已在 WaveSpeedAI 上提供,這個模型能生成自然延續現有畫面的額外影格——在動作、風格與氛圍上的無縫銜接,讓觀眾無法分辨原始影片的結束與延伸部分的開始。
什麼是 LTX-2.3 Video Extend?
LTX-2.3 Video Extend 建立在 LTX-2.3 基礎模型之上,採用 DiT 架構(擴散變換器),專為具有強大時間一致性的高品質影片生成而設計。LTX-2.3 系列包含文字轉影片與圖像轉影片等功能,而 Video Extend 變體則專注於一項特定且極具實用性的任務:取得現有的影片片段,並生成自然延續內容的新影格。
上傳影片,指定您需要的額外秒數(1 到 20 秒均可),並可選擇性地描述場景應如何演變。模型會分析來源素材的動作模式、視覺風格、光線與構圖,然後生成從最後一幀自然流暢延伸的續接內容。
結果是能保留原始影片特色的延長素材——攝影機運動沿著其軌跡繼續,物體維持其動量,環境細節保持一致。
主要功能
-
時間一致性:模型不只是生成合理的影格,而是生成與您特定來源影片連貫延續的影格。動作軌跡、光線變化與場景動態都自然延續。
-
彈性的時長控制:每次生成可將影片延長最短 1 秒、最長 20 秒。這種精細的控制讓您能精確添加所需內容,而不浪費資源。
-
選擇性提示詞引導:雖然模型可以在不輸入任何文字的情況下延長影片,但您可以提供描述場景應如何演變的提示詞。希望攝影機向左平移?讓角色開始行走?描述出來,模型就會將您的指示融入延伸內容中。
-
內建提示詞增強器:不確定如何描述您想要的延伸效果?整合的提示詞增強器會自動優化您的描述以獲得更好的結果。
-
在 WaveSpeedAI 上無冷啟動:模型始終處於準備就緒的狀態。提交您的請求並立即獲得結果,無需等待基礎設施啟動——這在您進行創意專案迭代且需要快速回饋循環時至關重要。
實際應用場景
社群媒體與短影片內容
4 秒的夕陽片段固然美麗,但在 Instagram 或 TikTok 上滑過太快。將其延長至 15 秒,您就擁有了一則能抓住注意力的完整貼文。內容創作者可以將手機捕捉的短暫瞬間轉化為精緻的完整影片,無需重新拍攝。
電影與影片製作
B-roll 是專業影片的骨幹,而且永遠不嫌多。延長空拍鏡頭、風景素材或氛圍片段,以填補剪輯中的空缺。3 秒的空拍飛越鏡頭可以變成承載整個場景轉換的 20 秒序列。
產品示範與行銷
產品影片需要精確的時間控制,以便與旁白和螢幕上的文字同步。當片段時間不夠時,延長幾秒鐘可維持視覺流暢度,避免尷尬的停頓或跳接。這對電商產品展示特別有用,流暢、連續的畫面能建立買家信心。
迴圈影片製作
生成額外影格以填補影片結尾與開頭之間的間隙,創造出無縫的迴圈影片,適用於數位看板、網站背景影片或環境氛圍展示。
敘事與動畫
動畫師和數位說故事者可以延長關鍵場景,給予重要時刻更多呼吸空間。角色的反應鏡頭、戲劇性的停頓或緩慢揭示,都可以被拉長以服務敘事,無需額外的手動影格製作。
在 WaveSpeedAI 上開始使用
使用 WaveSpeed Python SDK,只需幾行程式碼即可開始運行:
import wavespeed
output = wavespeed.run(
"wavespeed-ai/ltx-2.3/video-extend",
{
"video": "https://your-video-url.com/clip.mp4",
"duration": 10,
"prompt": "The camera continues to push forward through the forest as sunlight filters through the canopy"
},
)
print(output["outputs"][0])
就這樣。無需配置基礎設施,無需管理 GPU 實例,無冷啟動延遲。您提供影片和參數,WaveSpeedAI 處理其餘一切。
定價
LTX-2.3 Video Extend 採用簡單明瞭的按秒計費方式:
| 延長時長 | 費用 |
|---|---|
| 1 秒 | $0.10 |
| 5 秒 | $0.50 |
| 10 秒 | $1.00 |
| 20 秒 | $2.00 |
以每秒 $0.10 的價格,您可以自由實驗——先測試 1 秒延伸以驗證方法,對方向滿意後再擴展至更長的時長。
最佳效果使用技巧
- 提供清晰的來源素材:具有明確動作方向和一致光線的影片,能為模型提供最強的延伸訊號。
- 先短後長:在投入 20 秒的生成之前,先用 2-3 秒的延伸進行測試。這讓您能快速且低成本地迭代。
- 使用描述性提示詞:即使提示詞是選擇性的,它們也能顯著改善結果。描述攝影機運動、主體行為和環境變化。
- 考慮動作軌跡:當有明確的方向可以延續時,模型表現最佳——移動中的攝影機、行走中的主體、流動的水或飄動的雲。
突破您的創意邊界
LTX-2.3 Video Extend 消除了影片製作中最持久的摩擦點之一:固定片段長度的限制。無論您是將手機素材延伸成精緻內容的獨立創作者,還是延長精心拍攝的 B-roll 的製作團隊,這個模型都能以讓實驗變得可行的價格提供自然、連貫的延伸效果。
立即在 WaveSpeedAI 上試用 LTX-2.3 Video Extend,開始將您的短片段轉化為您真正需要的素材。





