Seedance 2.0 完整指南:多模態影片創作
Seedance 2.0 現已在 WaveSpeedAI 上線。透過這份全面指南掌握其多模態影片生成功能——結合圖像、影片、音訊與文字,精確掌控動態、風格與敘事表達。
現已在WaveSpeedAI上線。 全部14個 Seedance 2.0 端點均已開放——標準版與快速版,並提供低延遲的 Turbo 變體。
標準版: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend
快速版: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend
上線九折優惠持續至5月13日(UTC+0)。
Seedance 2.0 代表著AI影片生成的根本性轉變。這個模型不再僅依賴文字提示或單一參考圖片,而是接受圖片、影片、音頻與文字作為輸入——讓你像真正的電影導演一樣掌控創作的每個面向。
最突出的功能是其參考能力:你可以用圖片設定視覺風格、用影片指定動作與鏡頭運動、用音頻驅動節奏,再用文字引導敘事。由此帶來的掌控程度,是生成式影片領域前所未有的。
快速規格
| 參數 | 規格 |
|---|---|
| 圖片輸入 | 最多9張圖片 |
| 影片輸入 | 最多3個影片,總時長不超過15秒 |
| 音頻輸入 | 最多3個MP3檔案,總時長不超過15秒 |
| 文字輸入 | 自然語言提示詞 |
| 輸出時長 | 4–15秒(用戶可選) |
| 音頻輸出 | 原生音效與音樂 |
| 總檔案限制 | 每次生成最多12個檔案 |
使用多個檔案時,請優先選擇對最終輸出影響最大的素材——無論是用於動作的參考影片,還是用於角色一致性的圖片。
如何使用參考素材
Seedance 2.0 採用 @ 提及系統來指定每個上傳素材的用途,讓你明確控制每個檔案對生成結果的貢獻。
入口模式
- 首末幀模式:僅需起始圖片加提示詞時使用
- 通用參考模式:用於多模態組合(圖片+影片+音頻+文字)
@ 語法
上傳檔案後,在提示詞中使用 @ 加上檔案識別碼來引用:
@Image1 作為第一幀,參考 @Video1 的鏡頭運動,
使用 @Audio1 作為背景音樂
參考指令範例
| 使用場景 | 提示詞格式 |
|---|---|
| 設定第一幀 | @Image1 作為第一幀 |
| 參考動作 | 參考 @Video1 的打鬥編排 |
| 複製鏡頭運動 | 跟隨 @Video1 的鏡頭移動與轉場 |
| 添加音樂/節奏 | 使用 @Audio1 作為背景音樂 |
| 延伸影片 | 將 @Video1 延伸5秒 |
| 替換角色 | 用 @Image1 替換 @Video1 中的女性 |
核心功能
1. 提升基礎生成品質
Seedance 2.0 在基礎生成品質上帶來顯著提升:
- 物理精準度:物體按照真實世界規則下落、碰撞和互動
- 流暢動作:自然的動作,具備適當的動量與節奏
- 精準指令遵循:模型能理解並執行複雜提示詞
- 風格一致性:在整個影片中保持視覺連貫性
範例提示詞:
一個女孩優雅地晾衣服,晾好一件後伸手從籃子裡拿出另一件,
用力抖開。
模型能處理連續動作、布料物理效果和自然的肢體動作,無需額外說明。
2. 多模態參考系統
這是 Seedance 2.0 的決定性功能。你幾乎可以參考上傳素材中的任何元素:
- 來自參考影片的動作模式
- 來自創意模板的視覺效果與轉場
- 來自參考圖片的角色外觀
- 來自電影示例的鏡頭技術
- 來自音樂曲目的音頻節奏與氛圍
關鍵原則:用自然語言描述你想參考的內容。明確說明應從哪個檔案中提取哪個元素(動作、風格、鏡頭、角色)。
3. 角色與物件一致性
以往的模型難以在幀與幀之間保持身份一致性。Seedance 2.0 直接解決了這個問題:
- 臉部一致性:角色在整個影片中保持其外觀
- 產品細節保留:標誌、文字和精細細節保持準確
- 場景連貫性:環境在各個鏡頭中保持一致
- 風格鎖定:視覺風格在生成過程中不會漂移
範例提示詞:
男人 @Image1 下班後疲憊地回到家,走過走廊時放慢腳步,
在大門前停下。特寫他的臉,深吸一口氣,表情從緊繃轉為
放鬆。特寫他找到鑰匙,插入鎖孔。他推門而入,女兒和寵物
狗跑來擁抱他。室內溫馨舒適,全程有自然的對話。
4. 動作與鏡頭複製
上傳參考影片,Seedance 2.0 可以提取並應用:
- 複雜編舞:打鬥場面、舞蹈動作、動作場景
- 鏡頭技術:推軌鏡頭、跟蹤、吊臂運動、手持感
- 剪輯節奏:剪輯時機、轉場風格、節奏
- 特殊運動:希區柯克變焦、甩鏡、環繞鏡頭
範例提示詞:
參考 @Image1 中男性的外觀,場景設定在 @Image2 的電梯中。
完全複製 @Video1 的鏡頭運動和主角的面部表情。受到驚嚇時
使用希區柯克變焦,然後在電梯內進行多個環繞鏡頭。電梯門
打開,跟蹤鏡頭跟隨他出去。外景參考 @Image3,男子環顧四周。
參考 @Video1 的機械臂多角度跟蹤鏡頭,追蹤他的視線。
5. 創意模板複製
除了動作之外,你還可以複製完整的創意概念:
- 廣告格式:產品展示、生活方式蒙太奇、品牌故事
- 視覺效果:粒子系統、變形、風格化轉場
- 電影技術:開場序列、片名字卡、戲劇性揭示
- 剪輯風格:音樂影片剪輯、紀錄片節奏、商業片節奏
範例提示詞:
用 @Image1 中的女孩替換 @Video1 中的人物。用參考 @Image2
的天使替換月亮女神的CG。女孩蹲下時,背後長出翅膀。翅膀
掃過鏡頭形成轉場。參考 @Video1 的鏡頭運動和轉場。通過天使
的瞳孔進入下一個場景,天使俯瞰鏡頭(旋轉的翅膀與瞳孔相
呼應),鏡頭下降跟隨天使的臉,手臂抬起時拉遠鏡頭,露出
背景中的石天使雕像。全程一個連續鏡頭。
6. 影片延伸
在保持敘事連貫性的前提下延伸現有影片:
範例提示詞:
將 @Video1 延伸15秒。參考 @Image1 和 @Image2 中騎摩托車的
驢子角色。加入一段瘋狂的廣告片段:
場景一:側面鏡頭,驢子騎著摩托車衝破柵欄,附近的雞群
受驚四散。
場景二:驢子在沙地上進行旋轉特技,輪胎特寫,然後俯拍
驢子做圓圈動作,塵土飛揚。
場景三:山地背景,驢子從坡地飛躍而起,廣告文案通過遮罩
效果出現在身後(驢子經過時文字顯現):「激發創意,豐富
生活」。最終鏡頭:摩托車駛過,揚起一片塵雲。
7. 影片編輯
無需從頭重新生成即可修改現有影片:
- 角色替換:在保持動作的同時將一個人換成另一個人
- 元素添加/移除:添加物件、移除干擾元素
- 風格遷移:應用新的視覺處理方式
- 敘事改變:改變故事走向
範例提示詞:
顛覆 @Video1 的劇情。男人的表情瞬間從溫柔轉為冷酷無情。
在女人最意想不到的時刻,他將她推落橋下入水。推落動作果
決、蓄謀已久、毫不猶豫——完全顛覆了浪漫的人物設定。她
墜落時沒有尖叫,眼中只有難以置信。她浮出水面對他喊道:
「你從一開始就在騙我!」他站在橋上冷笑,輕聲說道:「這
是你家欠我家的。」
8. 音頻同步生成
Seedance 2.0 能生成帶有原生音頻的影片,並可與參考音頻同步:
- 多語言口型同步對話
- 與畫面動作匹配的音效
- 跟隨視覺節奏的背景音樂
- 帶有情感表達的配音
範例提示詞:
固定鏡頭。魚眼鏡頭從圓形開口向下俯視。參考 @Video1 的
魚眼效果。讓 @Video2 中的馬抬頭看向魚眼鏡頭。參考
@Video1 的說話動作。背景音頻參考 @Video3 的音效。
9. 節拍同步剪輯
創作與節拍完美契合的音樂影片風格內容:
範例提示詞:
海報中的女孩不斷更換服裝。服裝風格參考 @Image1 和
@Image2。她手持 @Image3 中的包包。影片節奏參考 @Video1。
多圖片與音樂同步:
@Image1 至 @Image7 根據 @Video1 的關鍵幀位置和整體節奏
進行剪輯。畫面中的人物更加動態。整體風格更加夢幻。視覺
衝擊力強。根據音樂和視覺流動需要調整參考圖片的取景。
鏡頭間加入燈光變化。
10. 單次連續長鏡頭
生成動作連貫的長鏡頭:
範例提示詞:
@Image1 至 @Image5,一個連續跟蹤鏡頭跟隨跑者上樓梯、
穿過走廊、到達屋頂,最後以城市俯瞰鏡頭結束。
範例提示詞:
諜戰風格。@Image1 作為第一幀。正面跟蹤鏡頭跟隨身穿紅色
大衣的女性向前走。全身跟蹤鏡頭。行人不斷遮擋畫面。她
走到一個街角,參考 @Image2 的街角建築。固定鏡頭,女性
走出畫面,消失在街角。一個戴面具的女孩在街角潛伏,惡意
地窺視,面具女孩的外觀參考 @Image3(僅外觀,她站在街角)。
鏡頭向前推進跟隨紅衣女性。她走進一棟豪宅後消失。豪宅
參考 @Image4。無剪輯。一個連續鏡頭。
創意應用
廣告與電商
創作帶有同步旁白、生活方式鏡頭和品牌故事的產品展示影片。多模態系統讓你在生成新內容的同時,能夠參考現有品牌素材。
內容本地化
生成帶有原生口型同步的多語言影片版本。參考原始影片的動作,同時用不同語言生成新的對話。
故事板轉影片
將靜態故事板轉換為動態序列。將你的分鏡板作為參考圖片上傳,並描述各幀之間的動作。
基於模板的創作
找到你喜歡的影片風格,將其作為參考上傳,然後用你自己的角色和場景生成該風格的新內容。
最佳實踐
-
明確說明參考用途:清楚寫明每個檔案的用途。「參考 @Video1 的鏡頭運動」比僅提及影片要好得多。
-
優先選擇素材:在12個檔案的限制下,選擇對輸出影響最大的素材。
-
核查 @ 提及:使用多個檔案時,仔細確認你沒有混淆哪張圖片、影片或音頻放在哪裡。
-
區分編輯與參考:明確說明你是要編輯現有影片,還是將其作為生成新內容的參考。
-
時長對齊:延伸影片時,將生成時長設置為與新增內容長度相符(例如延伸5秒 = 生成5秒)。
-
使用自然語言:模型能理解上下文。像向人類編輯描述需求一樣描述你想要的效果。
立即試用
Seedance 2.0 今日已在WaveSpeedAI上線。選擇適合你工作需求的版本:
- 最高保真度 — Seedance 2.0 T2V / I2V
- 最低延遲 — Seedance 2.0 Fast T2V Turbo / I2V Turbo
- 編輯現有素材 — Video Edit / Video Extend
上線九折優惠持續至5月13日(UTC+0)。瀏覽完整陣容請前往 Seedance 2.0 合集頁面。
後續計劃
Seedance 2.0 的多模態功能持續演進。隨著新功能和輸入組合的上線,我們將即時更新本指南。
如果你遇到問題或有功能請求,歡迎提供反饋——這是我們讓工具對所有人更好用的方式。
特定場景需要更少的內容限制? 試試WaveSpeedAI上的這些替代方案:
WAN 2.7 | Veo 3.1 Fast T2V | Veo 3.1 Fast I2V | Sora 2 T2V | Sora 2 I2V | Kling | Vidu
