Vidu 2.0 現已在 WaveSpeedAI 上線：可控視頻生成模型的新一代

我們很高興推出完整的 Vidu 2.0 模型系列—現已在 WaveSpeedAI 上提供。由晟書科技設計，這些模型為開源視頻生成帶來了新級別的 ** 可控性**、** 視覺保真度** 和 ** 時間一致性**。

從 圖像到視頻 到 ** 參考** 和 ** 起止幀受控合成**，Vidu 2.0 展示了當精確控制遇上高性能多模態建模時能實現的可能性。

通過 WaveSpeedAI，所有模型現在都可以通過實時 UI 或 API 獲得—將 SOTA 級別的視頻生成帶到您的瀏覽器或產品。

概述：什麼是 Vidu 2.0？

Vidu 2.0 是一系列開源擴散型視頻生成模型，在大規模高品質數據集上訓練，並進行了人類對齊調優。WaveSpeedAI 上的全部三個變體提供了進入可控視頻合成的不同入口點，支持從休閒創意到高需求內容創作管道的應用。

通過 WaveSpeedAI，您可以使用直觀的界面使用這些模型，或通過我們開發者友好的 API 將其集成到自訂管道中。

1. Vidu 2.0 - 圖像到視頻

關於

直接從單一圖像生成流暢、電影級的視頻。該模型推斷合理的動作和場景動態，將靜態照片擴展為時間豐富的敘事序列。

功能

高分辨率輸出（最高 1280×720）
時間一致性最長 80 到 160 幀（4 秒到 8 秒）
藝術和逼真攝影的靈活性
在面部和動作一致性上表現出色

用例

肖像動畫
歷史照片故事講述
風格化照片到視頻轉換
產品展示生成

🔗 wavespeed.ai/models/vidu/image-to-video-2.0

2. Vidu 2.0 - 參考到視頻

關於

生成視頻同時保留參考圖像的身份和風格。該模型針對面部和視覺一致性進行了優化，適合虛擬形象、網紅和品牌內容。

功能

身份鎖定生成
平順的時間轉換
一致的角色動作
視覺風格遵循

用例

數字網紅和虛擬形象
故事驅動的視頻角色
時尚或角色扮演生成
營銷個性化

🔗 wavespeed.ai/models/vidu/reference-to-video-2.0

3. Vidu 2.0 - 起止幀到視頻

關於

輸入起始和結束幀，模型在中間插值運動，生成可信、一致的視頻序列。這是高級故事講述和場景轉換的強大工具。

功能

雙幀引導合成
強敘事連續性
物體感知和人類感知的動作插值
適應相機運動和佈局變化

用例

故事板和概念動畫
長篇內容中的場景插值
教學視覺序列
電影前期視覺化

🔗 wavespeed.ai/models/vidu/start-end-to-video-2.0

立即在 WaveSpeedAI 上試試 Vidu 2.0

Vidu 2.0 不僅僅是另一個生成式模型—它是為控制和清晰性而設計的創意工具包。無論您是在動畫化靜止圖像、保留身份，還是在兩個時刻之間設計故事情節，Vidu 2.0 模型使創作者能夠自信地塑造動作。

所有三個模型在 WaveSpeedAI 上完全可用，並針對實時性能進行了優化。以互動方式測試它們，或通過我們的 API 集成它們。

Vidu 2.0 現已在 WaveSpeedAI 上線：可控視頻生成模型的新一代

概述：什麼是 Vidu 2.0？

1. Vidu 2.0 - 圖像到視頻

關於

功能

用例

2. Vidu 2.0 - 參考到視頻

關於

功能

用例

3. Vidu 2.0 - 起止幀到視頻

關於

功能

用例

立即在 WaveSpeedAI 上試試 Vidu 2.0

相關文章

Seedance 2.0即將推出：字節跳動下一代視頻模型，具有原生音頻功能

Seedance 2.0 完整指南：多模態視頻創建

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1：終極影片生成模型對比

Vidu Q3評測：與Sora 2、Wan 2.6、Seedance 1.5、Veo 3.1和Grok Imagine Video的對比

Grok Imagine Video 對比 Sora 2、Veo 3.1、Seedance 1.5、WAN 2.5/2.6 和 Vidu Q3：完整比較

Kling 3.0 有什麼值得期待：技術預覽