Vidu 2.0 现已登陆WaveSpeedAI
Vidu 2.0 现已在 WaveSpeedAI 上线:可控视频生成模型的新一代
我们很荣幸向您介绍完整的 Vidu 2.0 模型系列——现已在 WaveSpeedAI 上提供。由绳舒科技设计的这些模型为开源视频生成带来了新的 ** 可控性**、** 视觉保真度** 和 ** 时间一致性**。
从 图像转视频 到 ** 参考** 和 ** 首尾帧控制合成**,Vidu 2.0 展示了当精准度与高性能多模态建模相结合时的可能性。
通过 WaveSpeedAI,所有模型现在都可通过实时 UI 或 API 获得——为您的浏览器或产品带来 SOTA 级别的视频生成能力。
概览:什么是 Vidu 2.0?
Vidu 2.0 是一系列开源扩散模型,用于视频生成,在大规模、高质量数据集上训练,并进行了人类对齐的调优。WaveSpeedAI 上的三个变体都提供了进入可控视频合成的独特入口,支持从休闲创意到高需求内容创建管道。
通过 WaveSpeedAI,您可以通过直观的界面使用这些模型,或通过我们开发者友好的 API 将其集成到自定义管道中。
1. Vidu 2.0 - 图像转视频
关于
直接从单一图像生成平滑、电影级的视频。该模型推断出合理的运动和场景动态,将静态照片扩展为时间上丰富的叙事序列。
功能
- 高分辨率输出(最高 1280×720)
- 时间连贯性达 80 到 160 帧(4 秒到 8 秒)
- 艺术和照片写实灵活性
- 擅长面部和运动一致性
用例
- 肖像动画
- 历史照片叙事
- 风格化照片到视频转换
- 产品展示生成
🔗 wavespeed.ai/models/vidu/image-to-video-2.0
2. Vidu 2.0 - 参考转视频
关于
生成视频同时保留参考图像的身份和风格。该模型针对面部和视觉一致性进行了优化,适用于虚拟角色、网红和品牌内容。
功能
- 身份锁定生成
- 平滑的时间过渡
- 一致的角色运动
- 视觉风格保持
用例
- 数字网红和虚拟角色
- 故事驱动的视频角色
- 时尚或角色扮演生成
- 营销个性化
🔗 wavespeed.ai/models/vidu/reference-to-video-2.0
3. Vidu 2.0 - 首尾帧转视频
关于
输入首帧和末帧,模型对其间的运动进行插值,生成合理、一致的视频序列。这是一个用于高级叙事和场景转换的强大工具。
功能
- 双帧引导合成
- 强大的叙事连续性
- 物体感知和人类感知的运动插值
- 自适应摄像机运动和布局变化
用例
- 故事版和概念动画
- 长篇内容中的场景插值
- 教学视觉序列
- 电影前期可视化
🔗 wavespeed.ai/models/vidu/start-end-to-video-2.0
现在就在 WaveSpeedAI 上尝试 Vidu 2.0
Vidu 2.0 不仅仅是另一个生成模型——它是一个为控制和清晰度而设计的创意工具包。无论您是在动画化静止图像、保留身份,还是在两个时刻之间设计故事节奏,Vidu 2.0 模型都能使创意工作者满有信心地塑造运动。
所有三个模型都已完全可用并针对 WaveSpeedAI 上的实时性能进行了优化。以交互方式测试它们或通过我们的 API 集成它们。

