Seedance 2.0 完整指南：多模态视频创作

现已在 WaveSpeedAI 上线。 全部 14 个 Seedance 2.0 端点已开放——标准版和快速版，以及适用于低延迟运行的 Turbo 变体。

标准版： T2V · I2V · T2V Turbo · I2V Turbo · 视频编辑 · 视频编辑 Turbo · 视频延伸

快速版： T2V · I2V · T2V Turbo · I2V Turbo · 视频编辑 · 视频编辑 Turbo · 视频延伸

上线九折优惠持续至 5 月 13 日（UTC+0）。

Seedance 2.0 代表着 AI 视频生成领域的根本性变革。该模型不再单纯依赖文本提示或单张参考图像，而是接受图像、视频、音频和文本作为输入——让你像真正的电影导演一样，掌控创作的每一个细节。

最突出的特性是其参考能力：你可以用图像设定视觉风格，用视频指定运动和镜头语言，用音频驱动节奏，用文本引导叙事。由此实现的控制精度，在生成式视频领域此前从未有过。

快速规格

参数	规格说明
图像输入	最多 9 张图像
视频输入	最多 3 段视频，总时长不超过 15 秒
音频输入	最多 3 个 MP3 文件，总时长不超过 15 秒
文本输入	自然语言提示词
输出时长	4–15 秒（用户自选）
音频输出	原生音效和音乐
文件总数上限	每次生成最多 12 个文件

使用多个文件时，请优先选择对最终输出影响最大的素材——无论是用于动作参考的视频，还是用于角色一致性的图像。

如何使用参考素材

Seedance 2.0 使用 @ 提及系统来指定每个上传素材的用途，让你明确控制每个文件对生成内容的贡献。

入口模式

首/末帧模式：仅需起始图像加提示词时使用
通用参考模式：用于多模态组合（图像 + 视频 + 音频 + 文本）

@ 语法

上传文件后，在提示词中使用 @ 加文件标识符进行引用：

@Image1 作为第一帧，参考 @Video1 的镜头运动，
使用 @Audio1 作为背景音乐

参考指令示例

使用场景	提示词模式
设置首帧	`@Image1 作为第一帧`
参考动作	`参考 @Video1 的打斗编排`
复制镜头运动	`跟随 @Video1 的镜头运动和转场方式`
添加音乐/节奏	`使用 @Audio1 作为背景音乐`
延伸视频	`将 @Video1 延伸 5 秒`
替换角色	`用 @Image1 替换 @Video1 中的女性`

核心能力

1. 增强基础生成质量

Seedance 2.0 在基础生成质量上实现了显著提升：

物理精度：物体按照真实世界规律下落、碰撞和交互
流畅运动：自然的运动感，动量和时序处理恰当
精准指令遵循：模型理解并执行复杂提示词
风格一致性：整段视频保持视觉连贯性

示例提示词：

一个女孩优雅地晾晒衣物，挂好一件后伸手从篮子里取出另一件，
用力抖开。

模型可在无需明确指导的情况下，处理连续动作、布料物理和自然的肢体运动。

2. 多模态参考系统

这是 Seedance 2.0 的核心特性。你可以从上传的素材中参考几乎任何元素：

运动模式，来自参考视频
视觉效果和转场，来自创意模板
角色外观，来自参考图像
镜头技巧，来自影像示例
音频节奏与氛围，来自音乐曲目

核心原则：用自然语言描述你想要参考的内容。请明确指出应从哪个文件中提取哪种元素（动作、风格、镜头、角色）。

3. 角色与物体一致性

以往的模型在跨帧保持身份识别方面存在困难。Seedance 2.0 直接解决了这一问题：

面部一致性：角色在整个视频中保持外貌不变
产品细节保留：标志、文字和精细细节保持准确
场景连贯性：环境在不同镜头间保持统一
风格锁定：生成过程中视觉风格不会偏移

示例提示词：

男人 @Image1 拖着疲惫的身躯下班回家，走过走廊时步伐渐渐放慢，
停在门前。特写他的脸，深吸一口气，表情从紧绷逐渐舒展。特写
他摸出钥匙，插入锁孔。他推门而入，女儿和宠物狗跑来拥抱迎接。
室内温馨舒适，全程有自然的对话。

4. 动作与镜头复刻

上传参考视频后，Seedance 2.0 可提取并应用：

复杂编舞：打斗动作、舞蹈动作、动作场景
镜头技巧：推轨镜头、跟拍、摇臂运动、手持感
剪辑节奏：剪切时机、转场风格、叙事节奏
特殊运动：希区柯克变焦、甩镜、环绕镜头

示例提示词：

参考 @Image1 中男性的外貌，场景设置于 @Image2 的电梯环境。
完整复刻 @Video1 的镜头运动和主角面部表情。受惊时使用希区柯克
变焦，随后在电梯内进行数次环绕镜头。门开后，跟拍镜头跟随他
走出。外景参考 @Image3，男人环顾四周。参考 @Video1 中机械臂的
多角度跟踪镜头，追踪他的视线方向。

5. 创意模板复刻

除动作之外，你还可以复刻完整的创意概念：

广告形式：产品展示、生活方式蒙太奇、品牌故事
视觉效果：粒子系统、变形、风格化转场
影像技巧：开场序列、片名卡、戏剧性揭示
剪辑风格：MV剪辑、纪录片节奏、商业广告节奏

示例提示词：

用 @Image1 中的女孩替换 @Video1 中的人物。将月亮女神 CG 替换
为参考 @Image2 的天使形象。女孩蹲下时，背部长出翅膀。翅膀扫过
镜头完成转场。参考 @Video1 的镜头运动与转场方式。通过天使的
瞳孔进入下一个场景，俯拍天使（盘旋的翅膀与瞳孔呼应），镜头
跟随天使面部下降，举臂时拉开以露出背景中的石质天使雕像。全程
一镜到底。

6. 视频延伸

在保持叙事连贯性的前提下延伸现有视频：

示例提示词：

将 @Video1 延伸 15 秒。参考 @Image1 和 @Image2 中骑摩托的驴子
角色。加入一段狂野的广告段落：

场景一：侧面镜头，驴子骑着摩托冲破栅栏，附近的鸡被惊吓。

场景二：驴子在沙地上做旋转特技，轮胎特写后切换为俯拍全景，
展示驴子画圆，沙尘扬起。

场景三：山地背景，驴子从斜坡飞跃而出，广告文案通过遮罩效果
出现（驴子经过时文字逐渐显现）："激发创意，丰富生活"。结尾
镜头：摩托驶过，扬起一片尘土。

7. 视频编辑

在无需从头生成的情况下修改现有视频：

角色替换：在保留动作的情况下将一人替换为另一人
元素添加/移除：添加物体、去除干扰元素
风格迁移：应用新的视觉处理方式
叙事改变：改变故事走向

示例提示词：

颠覆 @Video1 的剧情。男人的表情瞬间从温柔变为冷酷无情。在女人
最没有防备的时刻，他将她推下桥落入水中。这一推动作果决、蓄谋
已久、毫不犹豫——彻底颠覆了浪漫的人物设定。她下坠时没有尖叫，
眼中只有难以置信。她浮出水面冲他喊道："你从一开始就在骗我！"
他站在桥上冷冷一笑，低声说道："这是你家欠我家的。"

8. 音频同步生成

Seedance 2.0 可生成带有原生音频的视频，并能与参考音频同步：

多语言唇形同步对白
与画面动作匹配的音效
跟随视觉节奏的背景音乐
带情感表达的配音

示例提示词：

固定镜头。鱼眼镜头从圆形开口向下俯视。参考 @Video1 的鱼眼效果。
让 @Video2 中的马抬头望向鱼眼镜头。参考 @Video1 的说话动作。
背景音效参考 @Video3 的音效。

9. 节拍同步剪辑

创作与节拍契合的音乐视频风格内容：

示例提示词：

海报中的女孩不断更换服装。服装风格参考 @Image1 和 @Image2。
她手持 @Image3 中的包袋。视频节奏参考 @Video1。

多张图像同步音乐：

@Image1 至 @Image7 按照 @Video1 的关键帧位置和整体节奏进行
剪切。画面中的人物动态更强。整体风格更具梦幻感。视觉冲击力强。
根据音乐和视觉流畅度适当调整参考图像的取景。在镜头之间添加
光效变化。

10. 长镜头连贯性

生成运动连贯的长镜头：

示例提示词：

@Image1 至 @Image5，一镜到底跟拍跑步者上楼梯、穿过走廊、
到达屋顶，以城市俯瞰视角结束。

示例提示词：

谍战风格。@Image1 作为第一帧。正面跟拍穿红色外套的女性向前
行走。全景跟随她。行人不断遮挡镜头。她走到转角，参考 @Image2
的转角建筑。固定镜头看着她走出画面，消失在转角后。一名戴面具
的女孩埋伏在转角窥视，面具女孩外貌参考 @Image3（仅外貌，她
站在转角处）。镜头向前推向红衣女性。她进入一栋大宅消失不见。
大宅参考 @Image4。无剪辑，一镜到底。

创意应用场景

广告与电商

结合同步旁白、生活方式镜头和品牌故事，创作产品展示视频。多模态系统让你在参考现有品牌素材的同时生成全新内容。

内容本地化

生成带有原生唇形同步的多语言视频版本。参考原始视频的动作，同时生成不同语言的新对白。

分镜到视频

将静态分镜草图转化为动态序列。上传分镜图作为参考图像，并描述图像之间的运动过程。

模板化创作

找到喜欢的视频风格，上传作为参考，以自己的角色和场景在该风格下生成新内容。

最佳实践

明确标注参考用途：清楚写明每个文件的具体用途。“参考 @Video1 的镜头运动”优于仅提及该视频。
优先选择关键素材：在 12 个文件的上限内，选择对输出影响最大的素材。
检查 @ 提及：使用多个文件时，仔细确认图像、视频和音频的对应关系是否正确。
区分编辑与参考：明确说明你是要编辑现有视频，还是将其作为生成新内容的参考。
时长对齐：延伸视频时，将生成时长设置为与新增内容的时长一致（例如延伸 5 秒 = 生成 5 秒）。
使用自然语言：模型能理解上下文。像向人类剪辑师描述需求一样描述你的想法。

立即体验

Seedance 2.0 今日已在 WaveSpeedAI 上线。根据你的需求选择对应版本：

最高画质 — Seedance 2.0 T2V / I2V
最低延迟 — Seedance 2.0 Fast T2V Turbo / I2V Turbo
编辑现有素材 — 视频编辑 / 视频延伸

上线九折优惠持续至 5 月 13 日（UTC+0）。浏览完整产品线，请访问 Seedance 2.0 合集页面。

后续计划

Seedance 2.0 的多模态能力仍在持续演进。随着新功能和输入组合方式的推出，我们将及时更新本指南。

如遇问题或有功能建议，欢迎反馈——这是我们持续改进工具、让所有人受益的重要途径。

特定镜头需要更少内容限制？ 试试 WaveSpeedAI 上的这些替代方案：

试用 Seedance 2.0 Mini — 更快、更省成本的版本，仅为标准价格的 50%：Seedance 2.0 Mini API。第一次接触 Seedance 2.0？Seedance 2.0 API。

快速规格

如何使用参考素材

入口模式

@ 语法

参考指令示例

核心能力

1. 增强基础生成质量

2. 多模态参考系统

3. 角色与物体一致性

4. 动作与镜头复刻

5. 创意模板复刻

6. 视频延伸

7. 视频编辑

8. 音频同步生成

9. 节拍同步剪辑

10. 长镜头连贯性

创意应用场景

广告与电商

内容本地化

分镜到视频

模板化创作

最佳实践

立即体验

后续计划

相关文章

Grok Imagine Video 1.5：xAI的图像转视频模型，支持原生音频

Vidu Q3 API：为全球开发者与企业团队消除AI视频核心瓶颈

NVIDIA Cosmos3-Nano 是什么？面向物理AI的160亿参数全模态世界模型

Gemini Omni Flash vs Seedance 2.0 vs Kling 3.0：多模态创作最佳AI视频模型对比

Kling 3.0 Omni详解：多镜头分镜、原生音频及其超越Veo之处

Runway的模型市场策略：对AI视频API意味着什么