← 博客

Vidu Q3 Start End To Video现已登陆WaveSpeedAI

Vidu Q3 Start End图像转视频可将文本提示词转化为具有卓越视觉保真度和多样化运动效果的高质量视频。即用型REST推理API,立即开始创作。

1 min read
Vidu Q3 Start End To Video
Vidu Q3 Start End To Video Vidu Q3 Start End图像转视频可将文本提示词转化为具有卓越视觉保真度和多样化运动效果的高质量视频。即用型R...
Try it
Vidu Q3 Start End To Video现已登陆WaveSpeedAI

在WaveSpeedAI上推出Vidu Q3首尾帧生视频

生数科技最先进的首尾帧视频模型正式上线。我们非常高兴地宣布,Vidu Q3首尾帧生视频现已在WaveSpeedAI上线——将全球排名顶尖的Vidu Q3生成能力带入精准的双关键帧视频创作。

Vidu Q3于2026年1月30日上线时引发广泛关注,在Artificial Analysis基准测试中荣登中国第一、全球第二。如今,通过首尾帧生视频变体,创作者能够在精确控制视频开头和结尾帧的同时,充分发挥这一行业领先的品质优势。只需提供起始图像、结尾图像和文字提示词,即可观看模型在两种状态之间生成流畅、电影感十足的过渡效果,分辨率最高可达1080p。

什么是Vidu Q3首尾帧生视频?

Vidu Q3首尾帧生视频是一款双关键帧插值模型,通过智能衔接两个参考帧来生成高质量视频。与从单张图像进行不可预测外推的标准图生视频模型不同,该模型同时锚定视频的开头和结尾,再合成两者之间自然的运动路径。

底层的Vidu Q3架构代表着相较于Q2的代际飞跃。基于生数科技先进的视觉Transformer基础,Q3在视觉保真度、运动连贯性和物理逻辑方面均有显著提升——独立测试给予其7.5/10的物理得分,物体交互真实自然,角色动作有重量感、自然流畅。与早期版本相比,帧级失真大幅减少,运动连续性明显更流畅。

首尾帧变体之所以特别强大,在于其可预测性。传统AI视频生成效果出众但难以控制。通过约束两个端点,创作者可以精准主导视频的叙事走向,同时仍能受益于Q3的电影级运动引擎和自然插值能力。

核心功能

Q3代视觉质量 Vidu Q3相较于任何以往的Vidu模型,生成图像更清晰、伪影更少。架构和数据增强方面的改进减少了闪烁并提升了运动连续性,输出效果看起来浑然天成,而非机械生成。

双帧精准控制 自由定义起始和结尾画面。模型在整个片段中保持主体的身份、光线、构图和空间关系,确保主体从第一帧到最后一帧始终保持一致。

流畅的物理感知插值 AI驱动的运动引擎在两个参考帧之间生成自然、流畅的运动。物体遵循真实物理规律,角色运动有重量感和目的性,镜头过渡具有电影级质感。

多种分辨率选项 可选540p、720p或1080p输出,在画质与成本之间灵活平衡。无论是以低分辨率快速验证创意,还是以全高清制作最终成品,模型均能适配您的工作流程。

运动幅度控制 精细调节过渡中的运动强度。细腻运动适合柔和变换,加大幅度则可实现戏剧性的形变和动作场景。

原生音频生成 继承自Q3架构的突出能力:可选择同步音频和背景音乐生成,且无需额外费用。视频可直接附带音效,省去单独音频制作的环节。

内置提示词增强器 集成的提示词增强工具可自动优化您的场景描述,帮助您在无需掌握复杂提示技巧的情况下获得更好的结果。

实际应用场景

电影级场景过渡

为电影、广告和音乐视频创建两个视觉状态之间的流畅过渡。输入开场镜头和结尾镜头,描述摄像机运动和动作,即可生成专业的衔接片段,否则这将需要昂贵的视觉特效制作。

产品形变与展示

以精致的视频过渡展示产品变换、颜色变化或功能改变。美妆品牌可在不同色号之间流畅切换,汽车制造商可在不同配置级别之间过渡——均以流畅、可控的运动呈现。

前后对比内容

健身成果、家居翻新、季节性景观变化——任何通过对比讲述故事的场景,都能从两种状态之间流畅、专业的视频过渡中受益。双帧控制确保”前”和”后”两个关键时刻都能精准呈现。

角色动画与姿态过渡

为角色从一个姿态或表情过渡到另一个制作动画。游戏开发者、动画师和内容创作者可快速原型化角色动作,无需手动设置关键帧,通过文字提示引导过渡的风格和节奏。

延时摄影与时间效果

以受控的起始和结尾点创建人工延时视频。通过自然的时间插值模拟日出到日落、季节变换或建筑施工进度。

故事板可视化预览

将静态故事板帧转化为动态序列。以关键画面作为起始和结尾图像,模型生成其间的运动——非常适合概念提案、检验剪辑节奏或在正式投入制作前预览镜头运动。

在WaveSpeedAI上快速上手

在WaveSpeedAI上使用Vidu Q3首尾帧生视频只需几个步骤:

  1. 上传起始图像 — 视频的第一帧
  2. 上传结尾图像 — 视频的最后一帧
  3. 编写提示词 — 描述帧与帧之间的运动、动作和过渡
  4. 设置时长 — 选择视频长度(默认:5秒)
  5. 选择分辨率 — 540p(速度优先)、720p(均衡)或1080p(最高画质)
  6. 调整运动(可选) — 通过幅度设置控制运动强度
  7. 启用音频(可选) — 开启同步音频和背景音乐
  8. 生成 — 提交并下载完成的视频

WaveSpeedAI的基础设施提供快速推理,无冷启动,无论需求量如何,视频均能快速生成。REST API可直接集成到现有生产流程和创意工作流中。

透明定价

费用按分辨率和时长线性增长,清晰可预期:

分辨率每秒费用5秒视频10秒视频
540p$0.07$0.35$0.70
720p$0.15$0.75$1.50
1080p$0.16$0.80$1.60

音频生成包含在内,无需额外费用。无订阅费,无隐藏费用——按实际生成量付费。

API集成

import wavespeed

output = wavespeed.run(
    "vidu/q3/start-end-to-video",
    {
        "prompt": "A smooth camera push-in as the flower blooms open",
        "image": "https://example.com/start-frame.jpg",
        "last_image": "https://example.com/end-frame.jpg",
        "duration": 5,
    },
)

print(output["outputs"][0])

为什么选择WaveSpeedAI?

  • 无冷启动 — 基础设施始终保持热态,从第一次请求到第一千次请求均能保持稳定的生成速度
  • 即用型REST API — 跳过基础设施搭建,立即开始生成
  • 实惠的按需付费定价 — 无订阅或承诺要求,按使用量灵活扩展
  • 企业级可靠性 — 为生产工作负载打造的基础设施,持续稳定运行

总结

Vidu Q3首尾帧生视频将全球第二的AI视频模型的强大能力带入精准引导的视频创作。通过将Q3卓越的视觉质量、物理感知运动和原生音频生成与双关键帧控制相结合,它实现了此前AI视频生成领域从未有过的创作精准度。

无论您是在打造电影级过渡、制作产品展示、为角色制作动画,还是预览故事板,这款模型都赋予您定义叙事端点的掌控力,而AI则负责处理中间的一切——完美呈现。

立即在WaveSpeedAI上体验Vidu Q3首尾帧生视频 →