Alibaba WAN 2.6 Video Extend 现已登陆WaveSpeedAI
Alibaba WAN 2.6 Video-Extend 可将短视频片段扩展为更长的视频,同时保留或生成同步音频以保持连贯性。提供开箱即用的 REST 推理 API
突破AI视频边界:阿里巴巴 WAN 2.6 Video-Extend 正式登陆 WaveSpeedAI
短片捕捉瞬间——但故事需要空间来呼吸。无论你是在为短片构建叙事序列、将产品演示拉长以满足平台要求,还是将三秒的定场镜头变成电影感的场景铺垫,视频时长始终是一个让人不得不额外拍摄或妥协的限制。这一切将随着 阿里巴巴 WAN 2.6 Video-Extend 登陆 WaveSpeedAI 而改变——这款新一代视频延伸模型能在数秒内将短片转化为更长、连贯流畅的序列,并可选配同步音频。
什么是阿里巴巴 WAN 2.6 Video-Extend?
WAN 2.6 Video-Extend 是阿里巴巴广受好评的 WAN 2.6 系列中的专项模型,专为生成自然延续源素材的额外帧而设计。输入一段视频片段和描述预期续接内容的文本提示,模型即可生成无缝延伸的视频,完整保留运动规律、光线、场景构图和视觉风格。
WAN 2.6 系列相较于前代产品实现了重大飞跃。阿里巴巴将 WAN 2.6 作为首款能够在单次推理中生成同步视频与音频的开源 AI 模型发布,Video-Extend 变体继承了这一能力。早期的视频延伸工具依赖帧插值或简单重复,往往产生明显的接缝和”AI 闪烁”——而 WAN 2.6 Video-Extend 采用先进的预测建模,生成视觉上与原始素材无法区分的全新内容。
在基准测试中,WAN 2.6 在场景稳定性和动作准确性方面领先,在整个延伸序列中保持一致的运动规律、角色细节和物理连贯性。相比 WAN 2.5,从手指渲染到复杂镜头运动,各方面的提升肉眼可见。
核心功能
-
无缝帧生成 — 新帧自然延续源视频的运动、光线和风格,无伪影、跳帧或闪烁。场景稳定性在当前视频延伸模型中属于最佳水平。
-
灵活时长控制 — 可将视频延伸 5、10 或 15 秒,满足从短社交内容到长叙事序列的各种创作需求。
-
音频同步延伸 — 上传音频文件,模型将生成与配乐对齐的视频。唇部动作、环境音效和节奏线索无需手动后期调整即可保持同步。
-
多分辨率输出 — 以 720p 或 1080p 生成延伸内容,以匹配源素材质量和预算要求。
-
提示词引导续接 — 描述视频的演变方式——镜头运动、动作变化、氛围转换——模型将精准遵循你的方向。
-
负向提示词支持 — 指定延伸内容中需排除的元素,让你对输出结果拥有精细的控制权。
-
内置提示词增强器 — 可选工具,自动优化你的描述以获得更好的生成效果。
-
多镜头构图 — 可在单镜头续接和多镜头延伸之间选择,后者在生成的素材中引入场景转换。
真实应用场景
影视制作
纪录片导演和叙事导演正在使用 AI 视频延伸来拉长定场镜头、补充素材和过渡序列,而无需额外的拍摄日。将一个开阔的风景镜头延伸 15 秒以配合音频旁白,或拉长对话节拍之间的戏剧性停顿。制作团队反映,通过避免因素材不够长而产生的重拍成本,每个项目可节省数千美元。
社交媒体与短视频内容
各平台要求差异显著——TikTok 偏好 15-30 秒的短片,Instagram Reels 在特定时长下表现最佳,YouTube Shorts 也有其最优区间。WAN 2.6 Video-Extend 让创作者能够将一段源素材优化为适配所有平台的版本。电商品牌延伸产品演示视频后,通过给观众更多时间了解产品细节,互动率提升超过 30%。
营销与广告
从单个主素材创作多种广告变体。通过多次延伸将 5 秒的产品揭秘变为 20 秒的展示,或为证言类视频增加余量以满足播出时长要求。一致的视觉质量确保每个变体都维持品牌的制作标准。
循环与展示内容
将环境素材——流水、城市延时摄影、氛围场景——延伸为更长的循环,用于数字标牌、活动背景或直播叠加层。无缝生成使循环自然衔接,无明显的重复节点。
创意实验
通过向意想不到的方向延伸捕捉到的瞬间,探索”接下来会发生什么”。用提示词引导日落场景过渡到夜晚,将舞蹈序列延续到新的动作,或让街景在原始拍摄之外继续演变。
在 WaveSpeedAI 上快速上手
在 WaveSpeedAI 上使用 WAN 2.6 Video-Extend 只需几个步骤:
- 上传源视频 — 提供你想要延伸的片段
- 撰写提示词 — 描述视频应如何延续(运动方向、场景变化、氛围)
- 添加音频(可选) — 上传配乐以实现同步延伸
- 选择设置 — 选择 720p 或 1080p 分辨率以及 5、10 或 15 秒的延伸时长
- 生成 — 提交并下载延伸后的视频
对于开发者,WaveSpeed API 让集成变得简单直接:
import wavespeed
output = wavespeed.run(
"alibaba/wan-2.6/video-extend",
{
"video": "https://example.com/your-clip.mp4",
"prompt": "The camera slowly pans right as the waves continue rolling onto shore at sunset",
"duration": 10,
},
)
print(output["outputs"][0])
定价
WAN 2.6 Video-Extend 提供透明、可预期的定价:
| 时长 | 720p | 1080p |
|---|---|---|
| 5 秒 | $0.50 | $0.75 |
| 10 秒 | $1.00 | $1.50 |
| 15 秒 | $1.50 | $2.25 |
最佳使用技巧
- 提示词尽量具体 — 描述镜头运动、主体动作和场景演变,而非抽象概念
- 分辨率与源素材匹配 — 720p 源素材使用 720p,高分辨率素材使用 1080p,以保持一致性
- 善用负向提示词 — 排除不需要的元素,如风格变化、文字叠加或场景跳转
- 启用提示词扩展 — 让内置增强器优化你的描述,提升生成质量
- 从 5 秒延伸开始 — 在投入更长时长生成之前,先用最短时长测试提示词和设置
为什么选择 WaveSpeedAI?
在 WaveSpeedAI 上运行 WAN 2.6 Video-Extend,让你享有生产级基础设施而无需额外开销:
- 无冷启动 — 为时间敏感的制作工作流提供稳定的响应时间
- 快速推理 — 专为视频生成工作负载优化的基础设施
- 即用型 REST API — 以最少的集成工作量接入你的现有流程
- 实惠透明的定价 — 按生成量付费,无隐藏费用或订阅锁定
改变你的视频工作方式
AI 视频延伸已从实验性新奇事物演变为不可或缺的制作工具。WAN 2.6 Video-Extend 代表着当前的技术前沿——将阿里巴巴在运动连贯性、场景稳定性和音视频同步方面的进步融合为一个能在生产质量上稳定交付的模型。
无论你是独立创作者,为更紧凑的叙事拉长素材;还是营销团队,生产平台优化的广告变体;抑或是制作公司,努力降低重拍成本——WAN 2.6 Video-Extend 都能让你按自己的方式灵活驾驭视频创作。



