Vidu 2.0 现已登陆WaveSpeedAI
Vidu 2.0 現已在 WaveSpeedAI 上線:可控視頻生成模型的新一代
我們很高興推出完整的 Vidu 2.0 模型系列—現已在 WaveSpeedAI 上提供。由晟書科技設計,這些模型為開源視頻生成帶來了新級別的 ** 可控性**、** 視覺保真度** 和 ** 時間一致性**。
從 圖像到視頻 到 ** 參考** 和 ** 起止幀受控合成**,Vidu 2.0 展示了當精確控制遇上高性能多模態建模時能實現的可能性。
通過 WaveSpeedAI,所有模型現在都可以通過實時 UI 或 API 獲得—將 SOTA 級別的視頻生成帶到您的瀏覽器或產品。
概述:什麼是 Vidu 2.0?
Vidu 2.0 是一系列開源擴散型視頻生成模型,在大規模高品質數據集上訓練,並進行了人類對齊調優。WaveSpeedAI 上的全部三個變體提供了進入可控視頻合成的不同入口點,支持從休閒創意到高需求內容創作管道的應用。
通過 WaveSpeedAI,您可以使用直觀的界面使用這些模型,或通過我們開發者友好的 API 將其集成到自訂管道中。
1. Vidu 2.0 - 圖像到視頻
關於
直接從單一圖像生成流暢、電影級的視頻。該模型推斷合理的動作和場景動態,將靜態照片擴展為時間豐富的敘事序列。
功能
- 高分辨率輸出(最高 1280×720)
- 時間一致性最長 80 到 160 幀(4 秒到 8 秒)
- 藝術和逼真攝影的靈活性
- 在面部和動作一致性上表現出色
用例
- 肖像動畫
- 歷史照片故事講述
- 風格化照片到視頻轉換
- 產品展示生成
🔗 wavespeed.ai/models/vidu/image-to-video-2.0
2. Vidu 2.0 - 參考到視頻
關於
生成視頻同時保留參考圖像的身份和風格。該模型針對面部和視覺一致性進行了優化,適合虛擬形象、網紅和品牌內容。
功能
- 身份鎖定生成
- 平順的時間轉換
- 一致的角色動作
- 視覺風格遵循
用例
- 數字網紅和虛擬形象
- 故事驅動的視頻角色
- 時尚或角色扮演生成
- 營銷個性化
🔗 wavespeed.ai/models/vidu/reference-to-video-2.0
3. Vidu 2.0 - 起止幀到視頻
關於
輸入起始和結束幀,模型在中間插值運動,生成可信、一致的視頻序列。這是高級故事講述和場景轉換的強大工具。
功能
- 雙幀引導合成
- 強敘事連續性
- 物體感知和人類感知的動作插值
- 適應相機運動和佈局變化
用例
- 故事板和概念動畫
- 長篇內容中的場景插值
- 教學視覺序列
- 電影前期視覺化
🔗 wavespeed.ai/models/vidu/start-end-to-video-2.0
立即在 WaveSpeedAI 上試試 Vidu 2.0
Vidu 2.0 不僅僅是另一個生成式模型—它是為控制和清晰性而設計的創意工具包。無論您是在動畫化靜止圖像、保留身份,還是在兩個時刻之間設計故事情節,Vidu 2.0 模型使創作者能夠自信地塑造動作。
所有三個模型在 WaveSpeedAI 上完全可用,並針對實時性能進行了優化。以互動方式測試它們,或通過我們的 API 集成它們。





