Veo 3.1：OpenAI Sora 2 的竞争对手即将到来

2025-04-02

sora openai video-generation

Veo 3.1：OpenAI Sora 2 的竞争对手即将到来

Veo 3 开启了AI视频生成的新篇章——当有声视频变成可能，而不仅仅是想象。在OpenAI的Sora 2 推出后，Google正在快速推进下一步。 Veo 3.1现已在WaveSpeedAI上推出——具备基于参考的视频生成、流畅的帧插值和高分辨率1080p输出 功能，使创作者能够制作更加一致、** 带同步声音的逼真视频**。

什么是Veo？

Veo是Google的AI视频模型系列，可以将文本或图像转化为带有声音的短视频——包括音乐、环境音和对白。 Veo 3有两个版本： Veo 3（标准版） – 用于高质量、电影级的效果。 Veo 3 Fast – 为更快的生成和测试进行了优化。

Veo 3.1有什么新功能

与Veo 3相比，3.1更新代表了一个基础模型升级——结合了更高保真的视觉真实感和上下文感知的同步音频生成。

这是迄今为止最接近真正的”文本到场景”电影制作引擎的版本。

更智能的视听融合

Veo 3.1中的新基础模型使视频和音频推理比以往任何时候都更紧密地结合在一起。

提示词：电影般的POV视频，超现实主义，8k，在日本的古老木制过山车上进行惊险的第一人称骑行，前排座位，完全无遮挡的视野。场景设定在黄金时段日落，投射出戏剧性的温暖光线。远处，雄伟的雪冠富士山……

在Veo 3.0中，过山车场景看起来很流畅，但内部是’无声的’——紧张感就不存在。

现在，Veo 3.1捕捉到每一声尖叫、风的呼啸声和金属的咔哒声，完美地与运动同步，让你沉浸在这场骑行中。

主体参考生成（R2V）：保留人脸和对象

与Veo 3.0不同，新的Veo 3.1允许你上传1-3张参考图像，使模型能够在每一帧中保持视觉一致性。

它保持人脸、动作和环境的对齐，消除了长视频中的角色漂移或尴尬的过渡。

提示词：一个留着胡须、戴着毛帽和安全眼镜的男人正在向木墙钻孔。钻头刚刚钻透了墙壁，露出了另一边充满阳光的、盛开野花的田野。男人暂停了钻孔，他的表情转变为惊叹和喜悦。他释放了钻头，现在站着两臂张开，面向美丽的花田，好像在拥抱他刚刚发现的新世界。来自花田的光线照亮了他的脸和墙边。

帧控制生成：开始、结束和中间的一切

你现在可以锁定你的第一帧和最后一帧，Veo 3.1将流畅地填充中间的所有内容。

提示词：一个穿着笔挺灰色西装、提着棕色皮革公文包的年轻男子自信地走在阳光照射的城市街道上，具有古典建筑……

Veo 3.1适合谁

🎥 数字主持人和虚拟形象：公司培训、新闻和娱乐。
🤖 客服代理：逼真、对话式的视频回复。
📚 教育和在线学习：传递长篇讲座内容。
🌍 内容本地化：可扩展的配音，具有精确的唇形同步。

立即在WaveSpeedAI上体验Veo 3.1

现在就在WaveSpeedAI上开始使用Veo 3.1进行创作！访问游乐场，上传你选择的图像，输入你的文本，然后点击生成。只需几秒钟，你的说话视频就准备好进行编辑了。

🔗text-to-video
🔗text-to-video-fast
🔗image-to-video
🔗image-to-video-fast
🔗reference-to-video