Vidu 2.0 现已在 WaveSpeedAI 上线：可控视频生成模型的新一代

我们很荣幸向您介绍完整的 Vidu 2.0 模型系列——现已在 WaveSpeedAI 上提供。由绳舒科技设计的这些模型为开源视频生成带来了新的 ** 可控性**、** 视觉保真度** 和 ** 时间一致性**。

从 图像转视频 到 ** 参考** 和 ** 首尾帧控制合成**，Vidu 2.0 展示了当精准度与高性能多模态建模相结合时的可能性。

通过 WaveSpeedAI，所有模型现在都可通过实时 UI 或 API 获得——为您的浏览器或产品带来 SOTA 级别的视频生成能力。

概览：什么是 Vidu 2.0？

Vidu 2.0 是一系列开源扩散模型，用于视频生成，在大规模、高质量数据集上训练，并进行了人类对齐的调优。WaveSpeedAI 上的三个变体都提供了进入可控视频合成的独特入口，支持从休闲创意到高需求内容创建管道。

通过 WaveSpeedAI，您可以通过直观的界面使用这些模型，或通过我们开发者友好的 API 将其集成到自定义管道中。

1. Vidu 2.0 - 图像转视频

关于

直接从单一图像生成平滑、电影级的视频。该模型推断出合理的运动和场景动态，将静态照片扩展为时间上丰富的叙事序列。

功能

高分辨率输出（最高 1280×720）
时间连贯性达 80 到 160 帧（4 秒到 8 秒）
艺术和照片写实灵活性
擅长面部和运动一致性

用例

肖像动画
历史照片叙事
风格化照片到视频转换
产品展示生成

🔗 wavespeed.ai/models/vidu/image-to-video-2.0

2. Vidu 2.0 - 参考转视频

关于

生成视频同时保留参考图像的身份和风格。该模型针对面部和视觉一致性进行了优化，适用于虚拟角色、网红和品牌内容。

功能

身份锁定生成
平滑的时间过渡
一致的角色运动
视觉风格保持

用例

数字网红和虚拟角色
故事驱动的视频角色
时尚或角色扮演生成
营销个性化

🔗 wavespeed.ai/models/vidu/reference-to-video-2.0

3. Vidu 2.0 - 首尾帧转视频

关于

输入首帧和末帧，模型对其间的运动进行插值，生成合理、一致的视频序列。这是一个用于高级叙事和场景转换的强大工具。

功能

双帧引导合成
强大的叙事连续性
物体感知和人类感知的运动插值
自适应摄像机运动和布局变化

用例

故事版和概念动画
长篇内容中的场景插值
教学视觉序列
电影前期可视化

🔗 wavespeed.ai/models/vidu/start-end-to-video-2.0

现在就在 WaveSpeedAI 上尝试 Vidu 2.0

Vidu 2.0 不仅仅是另一个生成模型——它是一个为控制和清晰度而设计的创意工具包。无论您是在动画化静止图像、保留身份，还是在两个时刻之间设计故事节奏，Vidu 2.0 模型都能使创意工作者满有信心地塑造运动。

所有三个模型都已完全可用并针对 WaveSpeedAI 上的实时性能进行了优化。以交互方式测试它们或通过我们的 API 集成它们。

Vidu 2.0 现已在 WaveSpeedAI 上线：可控视频生成模型的新一代

概览：什么是 Vidu 2.0？

1. Vidu 2.0 - 图像转视频

关于

功能

用例

2. Vidu 2.0 - 参考转视频

关于

功能

用例

3. Vidu 2.0 - 首尾帧转视频

关于

功能

用例

现在就在 WaveSpeedAI 上尝试 Vidu 2.0

相关文章

Seedance 2.0现已登陆WaveSpeedAI：字节跳动下一代视频模型，原生音频生成

Seedance 2.0完整指南：多模态视频创建

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1：终极视频生成对比

Vidu Q3 评测：与 Sora 2、Wan 2.6、Seedance 1.5、Veo 3.1 和 Grok Imagine Video 的对比

Grok Imagine Video vs Sora 2、Veo 3.1、Seedance 1.5、WAN 2.5/2.6 和 Vidu Q3：完整对比

期待Kling 3.0：技术预览