Vidu Q3 Start End To Video现已登陆WaveSpeedAI

在WaveSpeedAI上推出Vidu Q3首尾帧生视频

生数科技最先进的首尾帧视频模型正式上线。我们非常高兴地宣布，Vidu Q3首尾帧生视频现已在WaveSpeedAI上线——将全球排名顶尖的Vidu Q3生成能力带入精准的双关键帧视频创作。

Vidu Q3于2026年1月30日上线时引发广泛关注，在Artificial Analysis基准测试中荣登中国第一、全球第二。如今，通过首尾帧生视频变体，创作者能够在精确控制视频开头和结尾帧的同时，充分发挥这一行业领先的品质优势。只需提供起始图像、结尾图像和文字提示词，即可观看模型在两种状态之间生成流畅、电影感十足的过渡效果，分辨率最高可达1080p。

什么是Vidu Q3首尾帧生视频？

Vidu Q3首尾帧生视频是一款双关键帧插值模型，通过智能衔接两个参考帧来生成高质量视频。与从单张图像进行不可预测外推的标准图生视频模型不同，该模型同时锚定视频的开头和结尾，再合成两者之间自然的运动路径。

底层的Vidu Q3架构代表着相较于Q2的代际飞跃。基于生数科技先进的视觉Transformer基础，Q3在视觉保真度、运动连贯性和物理逻辑方面均有显著提升——独立测试给予其7.5/10的物理得分，物体交互真实自然，角色动作有重量感、自然流畅。与早期版本相比，帧级失真大幅减少，运动连续性明显更流畅。

首尾帧变体之所以特别强大，在于其可预测性。传统AI视频生成效果出众但难以控制。通过约束两个端点，创作者可以精准主导视频的叙事走向，同时仍能受益于Q3的电影级运动引擎和自然插值能力。

核心功能

Q3代视觉质量 Vidu Q3相较于任何以往的Vidu模型，生成图像更清晰、伪影更少。架构和数据增强方面的改进减少了闪烁并提升了运动连续性，输出效果看起来浑然天成，而非机械生成。

双帧精准控制 自由定义起始和结尾画面。模型在整个片段中保持主体的身份、光线、构图和空间关系，确保主体从第一帧到最后一帧始终保持一致。

流畅的物理感知插值 AI驱动的运动引擎在两个参考帧之间生成自然、流畅的运动。物体遵循真实物理规律，角色运动有重量感和目的性，镜头过渡具有电影级质感。

多种分辨率选项 可选540p、720p或1080p输出，在画质与成本之间灵活平衡。无论是以低分辨率快速验证创意，还是以全高清制作最终成品，模型均能适配您的工作流程。

运动幅度控制 精细调节过渡中的运动强度。细腻运动适合柔和变换，加大幅度则可实现戏剧性的形变和动作场景。

原生音频生成 继承自Q3架构的突出能力：可选择同步音频和背景音乐生成，且无需额外费用。视频可直接附带音效，省去单独音频制作的环节。

内置提示词增强器 集成的提示词增强工具可自动优化您的场景描述，帮助您在无需掌握复杂提示技巧的情况下获得更好的结果。

实际应用场景

电影级场景过渡

为电影、广告和音乐视频创建两个视觉状态之间的流畅过渡。输入开场镜头和结尾镜头，描述摄像机运动和动作，即可生成专业的衔接片段，否则这将需要昂贵的视觉特效制作。

产品形变与展示

以精致的视频过渡展示产品变换、颜色变化或功能改变。美妆品牌可在不同色号之间流畅切换，汽车制造商可在不同配置级别之间过渡——均以流畅、可控的运动呈现。

前后对比内容

健身成果、家居翻新、季节性景观变化——任何通过对比讲述故事的场景，都能从两种状态之间流畅、专业的视频过渡中受益。双帧控制确保”前”和”后”两个关键时刻都能精准呈现。

角色动画与姿态过渡

为角色从一个姿态或表情过渡到另一个制作动画。游戏开发者、动画师和内容创作者可快速原型化角色动作，无需手动设置关键帧，通过文字提示引导过渡的风格和节奏。

延时摄影与时间效果

以受控的起始和结尾点创建人工延时视频。通过自然的时间插值模拟日出到日落、季节变换或建筑施工进度。

故事板可视化预览

将静态故事板帧转化为动态序列。以关键画面作为起始和结尾图像，模型生成其间的运动——非常适合概念提案、检验剪辑节奏或在正式投入制作前预览镜头运动。

在WaveSpeedAI上快速上手

在WaveSpeedAI上使用Vidu Q3首尾帧生视频只需几个步骤：

上传起始图像 — 视频的第一帧
上传结尾图像 — 视频的最后一帧
编写提示词 — 描述帧与帧之间的运动、动作和过渡
设置时长 — 选择视频长度（默认：5秒）
选择分辨率 — 540p（速度优先）、720p（均衡）或1080p（最高画质）
调整运动（可选） — 通过幅度设置控制运动强度
启用音频（可选） — 开启同步音频和背景音乐
生成 — 提交并下载完成的视频

WaveSpeedAI的基础设施提供快速推理，无冷启动，无论需求量如何，视频均能快速生成。REST API可直接集成到现有生产流程和创意工作流中。

透明定价

费用按分辨率和时长线性增长，清晰可预期：

分辨率	每秒费用	5秒视频	10秒视频
540p	$0.07	$0.35	$0.70
720p	$0.15	$0.75	$1.50
1080p	$0.16	$0.80	$1.60

音频生成包含在内，无需额外费用。无订阅费，无隐藏费用——按实际生成量付费。

API集成

import wavespeed

output = wavespeed.run(
    "vidu/q3/start-end-to-video",
    {
        "prompt": "A smooth camera push-in as the flower blooms open",
        "image": "https://example.com/start-frame.jpg",
        "last_image": "https://example.com/end-frame.jpg",
        "duration": 5,
    },
)

print(output["outputs"][0])