Seedance 2.0 完整指南:多模态视频创作
Seedance 2.0 现已在 WaveSpeedAI 上线。通过这份全面指南掌握其多模态视频生成能力——结合图像、视频、音频与文本,精确控制运动、风格和叙事表达。
现已在 WaveSpeedAI 上线。 全部 14 个 Seedance 2.0 端点已开放——标准版和快速版,以及适用于低延迟运行的 Turbo 变体。
标准版: T2V · I2V · T2V Turbo · I2V Turbo · 视频编辑 · 视频编辑 Turbo · 视频延伸
快速版: T2V · I2V · T2V Turbo · I2V Turbo · 视频编辑 · 视频编辑 Turbo · 视频延伸
上线九折优惠持续至 5 月 13 日(UTC+0)。
Seedance 2.0 代表着 AI 视频生成领域的根本性变革。该模型不再单纯依赖文本提示或单张参考图像,而是接受图像、视频、音频和文本作为输入——让你像真正的电影导演一样,掌控创作的每一个细节。
最突出的特性是其参考能力:你可以用图像设定视觉风格,用视频指定运动和镜头语言,用音频驱动节奏,用文本引导叙事。由此实现的控制精度,在生成式视频领域此前从未有过。
快速规格
| 参数 | 规格说明 |
|---|---|
| 图像输入 | 最多 9 张图像 |
| 视频输入 | 最多 3 段视频,总时长不超过 15 秒 |
| 音频输入 | 最多 3 个 MP3 文件,总时长不超过 15 秒 |
| 文本输入 | 自然语言提示词 |
| 输出时长 | 4–15 秒(用户自选) |
| 音频输出 | 原生音效和音乐 |
| 文件总数上限 | 每次生成最多 12 个文件 |
使用多个文件时,请优先选择对最终输出影响最大的素材——无论是用于动作参考的视频,还是用于角色一致性的图像。
如何使用参考素材
Seedance 2.0 使用 @ 提及系统来指定每个上传素材的用途,让你明确控制每个文件对生成内容的贡献。
入口模式
- 首/末帧模式:仅需起始图像加提示词时使用
- 通用参考模式:用于多模态组合(图像 + 视频 + 音频 + 文本)
@ 语法
上传文件后,在提示词中使用 @ 加文件标识符进行引用:
@Image1 作为第一帧,参考 @Video1 的镜头运动,
使用 @Audio1 作为背景音乐
参考指令示例
| 使用场景 | 提示词模式 |
|---|---|
| 设置首帧 | @Image1 作为第一帧 |
| 参考动作 | 参考 @Video1 的打斗编排 |
| 复制镜头运动 | 跟随 @Video1 的镜头运动和转场方式 |
| 添加音乐/节奏 | 使用 @Audio1 作为背景音乐 |
| 延伸视频 | 将 @Video1 延伸 5 秒 |
| 替换角色 | 用 @Image1 替换 @Video1 中的女性 |
核心能力
1. 增强基础生成质量
Seedance 2.0 在基础生成质量上实现了显著提升:
- 物理精度:物体按照真实世界规律下落、碰撞和交互
- 流畅运动:自然的运动感,动量和时序处理恰当
- 精准指令遵循:模型理解并执行复杂提示词
- 风格一致性:整段视频保持视觉连贯性
示例提示词:
一个女孩优雅地晾晒衣物,挂好一件后伸手从篮子里取出另一件,
用力抖开。
模型可在无需明确指导的情况下,处理连续动作、布料物理和自然的肢体运动。
2. 多模态参考系统
这是 Seedance 2.0 的核心特性。你可以从上传的素材中参考几乎任何元素:
- 运动模式,来自参考视频
- 视觉效果和转场,来自创意模板
- 角色外观,来自参考图像
- 镜头技巧,来自影像示例
- 音频节奏与氛围,来自音乐曲目
核心原则:用自然语言描述你想要参考的内容。请明确指出应从哪个文件中提取哪种元素(动作、风格、镜头、角色)。
3. 角色与物体一致性
以往的模型在跨帧保持身份识别方面存在困难。Seedance 2.0 直接解决了这一问题:
- 面部一致性:角色在整个视频中保持外貌不变
- 产品细节保留:标志、文字和精细细节保持准确
- 场景连贯性:环境在不同镜头间保持统一
- 风格锁定:生成过程中视觉风格不会偏移
示例提示词:
男人 @Image1 拖着疲惫的身躯下班回家,走过走廊时步伐渐渐放慢,
停在门前。特写他的脸,深吸一口气,表情从紧绷逐渐舒展。特写
他摸出钥匙,插入锁孔。他推门而入,女儿和宠物狗跑来拥抱迎接。
室内温馨舒适,全程有自然的对话。
4. 动作与镜头复刻
上传参考视频后,Seedance 2.0 可提取并应用:
- 复杂编舞:打斗动作、舞蹈动作、动作场景
- 镜头技巧:推轨镜头、跟拍、摇臂运动、手持感
- 剪辑节奏:剪切时机、转场风格、叙事节奏
- 特殊运动:希区柯克变焦、甩镜、环绕镜头
示例提示词:
参考 @Image1 中男性的外貌,场景设置于 @Image2 的电梯环境。
完整复刻 @Video1 的镜头运动和主角面部表情。受惊时使用希区柯克
变焦,随后在电梯内进行数次环绕镜头。门开后,跟拍镜头跟随他
走出。外景参考 @Image3,男人环顾四周。参考 @Video1 中机械臂的
多角度跟踪镜头,追踪他的视线方向。
5. 创意模板复刻
除动作之外,你还可以复刻完整的创意概念:
- 广告形式:产品展示、生活方式蒙太奇、品牌故事
- 视觉效果:粒子系统、变形、风格化转场
- 影像技巧:开场序列、片名卡、戏剧性揭示
- 剪辑风格:MV剪辑、纪录片节奏、商业广告节奏
示例提示词:
用 @Image1 中的女孩替换 @Video1 中的人物。将月亮女神 CG 替换
为参考 @Image2 的天使形象。女孩蹲下时,背部长出翅膀。翅膀扫过
镜头完成转场。参考 @Video1 的镜头运动与转场方式。通过天使的
瞳孔进入下一个场景,俯拍天使(盘旋的翅膀与瞳孔呼应),镜头
跟随天使面部下降,举臂时拉开以露出背景中的石质天使雕像。全程
一镜到底。
6. 视频延伸
在保持叙事连贯性的前提下延伸现有视频:
示例提示词:
将 @Video1 延伸 15 秒。参考 @Image1 和 @Image2 中骑摩托的驴子
角色。加入一段狂野的广告段落:
场景一:侧面镜头,驴子骑着摩托冲破栅栏,附近的鸡被惊吓。
场景二:驴子在沙地上做旋转特技,轮胎特写后切换为俯拍全景,
展示驴子画圆,沙尘扬起。
场景三:山地背景,驴子从斜坡飞跃而出,广告文案通过遮罩效果
出现(驴子经过时文字逐渐显现):"激发创意,丰富生活"。结尾
镜头:摩托驶过,扬起一片尘土。
7. 视频编辑
在无需从头生成的情况下修改现有视频:
- 角色替换:在保留动作的情况下将一人替换为另一人
- 元素添加/移除:添加物体、去除干扰元素
- 风格迁移:应用新的视觉处理方式
- 叙事改变:改变故事走向
示例提示词:
颠覆 @Video1 的剧情。男人的表情瞬间从温柔变为冷酷无情。在女人
最没有防备的时刻,他将她推下桥落入水中。这一推动作果决、蓄谋
已久、毫不犹豫——彻底颠覆了浪漫的人物设定。她下坠时没有尖叫,
眼中只有难以置信。她浮出水面冲他喊道:"你从一开始就在骗我!"
他站在桥上冷冷一笑,低声说道:"这是你家欠我家的。"
8. 音频同步生成
Seedance 2.0 可生成带有原生音频的视频,并能与参考音频同步:
- 多语言唇形同步对白
- 与画面动作匹配的音效
- 跟随视觉节奏的背景音乐
- 带情感表达的配音
示例提示词:
固定镜头。鱼眼镜头从圆形开口向下俯视。参考 @Video1 的鱼眼效果。
让 @Video2 中的马抬头望向鱼眼镜头。参考 @Video1 的说话动作。
背景音效参考 @Video3 的音效。
9. 节拍同步剪辑
创作与节拍契合的音乐视频风格内容:
示例提示词:
海报中的女孩不断更换服装。服装风格参考 @Image1 和 @Image2。
她手持 @Image3 中的包袋。视频节奏参考 @Video1。
多张图像同步音乐:
@Image1 至 @Image7 按照 @Video1 的关键帧位置和整体节奏进行
剪切。画面中的人物动态更强。整体风格更具梦幻感。视觉冲击力强。
根据音乐和视觉流畅度适当调整参考图像的取景。在镜头之间添加
光效变化。
10. 长镜头连贯性
生成运动连贯的长镜头:
示例提示词:
@Image1 至 @Image5,一镜到底跟拍跑步者上楼梯、穿过走廊、
到达屋顶,以城市俯瞰视角结束。
示例提示词:
谍战风格。@Image1 作为第一帧。正面跟拍穿红色外套的女性向前
行走。全景跟随她。行人不断遮挡镜头。她走到转角,参考 @Image2
的转角建筑。固定镜头看着她走出画面,消失在转角后。一名戴面具
的女孩埋伏在转角窥视,面具女孩外貌参考 @Image3(仅外貌,她
站在转角处)。镜头向前推向红衣女性。她进入一栋大宅消失不见。
大宅参考 @Image4。无剪辑,一镜到底。
创意应用场景
广告与电商
结合同步旁白、生活方式镜头和品牌故事,创作产品展示视频。多模态系统让你在参考现有品牌素材的同时生成全新内容。
内容本地化
生成带有原生唇形同步的多语言视频版本。参考原始视频的动作,同时生成不同语言的新对白。
分镜到视频
将静态分镜草图转化为动态序列。上传分镜图作为参考图像,并描述图像之间的运动过程。
模板化创作
找到喜欢的视频风格,上传作为参考,以自己的角色和场景在该风格下生成新内容。
最佳实践
-
明确标注参考用途:清楚写明每个文件的具体用途。“参考 @Video1 的镜头运动”优于仅提及该视频。
-
优先选择关键素材:在 12 个文件的上限内,选择对输出影响最大的素材。
-
检查 @ 提及:使用多个文件时,仔细确认图像、视频和音频的对应关系是否正确。
-
区分编辑与参考:明确说明你是要编辑现有视频,还是将其作为生成新内容的参考。
-
时长对齐:延伸视频时,将生成时长设置为与新增内容的时长一致(例如延伸 5 秒 = 生成 5 秒)。
-
使用自然语言:模型能理解上下文。像向人类剪辑师描述需求一样描述你的想法。
立即体验
Seedance 2.0 今日已在 WaveSpeedAI 上线。根据你的需求选择对应版本:
- 最高画质 — Seedance 2.0 T2V / I2V
- 最低延迟 — Seedance 2.0 Fast T2V Turbo / I2V Turbo
- 编辑现有素材 — 视频编辑 / 视频延伸
上线九折优惠持续至 5 月 13 日(UTC+0)。浏览完整产品线,请访问 Seedance 2.0 合集页面。
后续计划
Seedance 2.0 的多模态能力仍在持续演进。随着新功能和输入组合方式的推出,我们将及时更新本指南。
如遇问题或有功能建议,欢迎反馈——这是我们持续改进工具、让所有人受益的重要途径。
特定镜头需要更少内容限制? 试试 WaveSpeedAI 上的这些替代方案:
WAN 2.7 | Veo 3.1 Fast T2V | Veo 3.1 Fast I2V | Sora 2 T2V | Sora 2 I2V | Kling | Vidu
