Vidu 2.0 现已登陆WaveSpeedAI

Vidu 2.0 现已登陆WaveSpeedAI

Vidu 2.0 現已在 WaveSpeedAI 上線:可控視頻生成模型的新一代

我們很高興推出完整的 Vidu 2.0 模型系列—現已在 WaveSpeedAI 上提供。由晟書科技設計,這些模型為開源視頻生成帶來了新級別的 ** 可控性**、** 視覺保真度** 和 ** 時間一致性**。

圖像到視頻 到 ** 參考** 和 ** 起止幀受控合成**,Vidu 2.0 展示了當精確控制遇上高性能多模態建模時能實現的可能性。

通過 WaveSpeedAI,所有模型現在都可以通過實時 UI 或 API 獲得—將 SOTA 級別的視頻生成帶到您的瀏覽器或產品。

概述:什麼是 Vidu 2.0?

Vidu 2.0 是一系列開源擴散型視頻生成模型,在大規模高品質數據集上訓練,並進行了人類對齊調優。WaveSpeedAI 上的全部三個變體提供了進入可控視頻合成的不同入口點,支持從休閒創意到高需求內容創作管道的應用。

通過 WaveSpeedAI,您可以使用直觀的界面使用這些模型,或通過我們開發者友好的 API 將其集成到自訂管道中。

1. Vidu 2.0 - 圖像到視頻

關於

直接從單一圖像生成流暢、電影級的視頻。該模型推斷合理的動作和場景動態,將靜態照片擴展為時間豐富的敘事序列。

功能

  • 高分辨率輸出(最高 1280×720)
  • 時間一致性最長 80 到 160 幀(4 秒到 8 秒)
  • 藝術和逼真攝影的靈活性
  • 在面部和動作一致性上表現出色

用例

  • 肖像動畫
  • 歷史照片故事講述
  • 風格化照片到視頻轉換
  • 產品展示生成

🔗 wavespeed.ai/models/vidu/image-to-video-2.0

2. Vidu 2.0 - 參考到視頻

關於

生成視頻同時保留參考圖像的身份和風格。該模型針對面部和視覺一致性進行了優化,適合虛擬形象、網紅和品牌內容。

功能

  • 身份鎖定生成
  • 平順的時間轉換
  • 一致的角色動作
  • 視覺風格遵循

用例

  • 數字網紅和虛擬形象
  • 故事驅動的視頻角色
  • 時尚或角色扮演生成
  • 營銷個性化

🔗 wavespeed.ai/models/vidu/reference-to-video-2.0

3. Vidu 2.0 - 起止幀到視頻

關於

輸入起始和結束幀,模型在中間插值運動,生成可信、一致的視頻序列。這是高級故事講述和場景轉換的強大工具。

功能

  • 雙幀引導合成
  • 強敘事連續性
  • 物體感知和人類感知的動作插值
  • 適應相機運動和佈局變化

用例

  • 故事板和概念動畫
  • 長篇內容中的場景插值
  • 教學視覺序列
  • 電影前期視覺化

🔗 wavespeed.ai/models/vidu/start-end-to-video-2.0

立即在 WaveSpeedAI 上試試 Vidu 2.0

Vidu 2.0 不僅僅是另一個生成式模型—它是為控制和清晰性而設計的創意工具包。無論您是在動畫化靜止圖像、保留身份,還是在兩個時刻之間設計故事情節,Vidu 2.0 模型使創作者能夠自信地塑造動作。

所有三個模型在 WaveSpeedAI 上完全可用,並針對實時性能進行了優化。以互動方式測試它們,或通過我們的 API 集成它們。