← 部落格

Seedance 2.0 完整指南:多模態影片創作

Seedance 2.0 現已在 WaveSpeedAI 上線。透過這份全面指南掌握其多模態影片生成功能——結合圖像、影片、音訊與文字,精確掌控動態、風格與敘事表達。

3 min read

現已在WaveSpeedAI上線。 全部14個 Seedance 2.0 端點均已開放——標準版與快速版,並提供低延遲的 Turbo 變體。

標準版: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend

快速版: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend

上線九折優惠持續至5月13日(UTC+0)。

Seedance 2.0 代表著AI影片生成的根本性轉變。這個模型不再僅依賴文字提示或單一參考圖片,而是接受圖片、影片、音頻與文字作為輸入——讓你像真正的電影導演一樣掌控創作的每個面向。

最突出的功能是其參考能力:你可以用圖片設定視覺風格、用影片指定動作與鏡頭運動、用音頻驅動節奏,再用文字引導敘事。由此帶來的掌控程度,是生成式影片領域前所未有的。


快速規格

參數規格
圖片輸入最多9張圖片
影片輸入最多3個影片,總時長不超過15秒
音頻輸入最多3個MP3檔案,總時長不超過15秒
文字輸入自然語言提示詞
輸出時長4–15秒(用戶可選)
音頻輸出原生音效與音樂
總檔案限制每次生成最多12個檔案

使用多個檔案時,請優先選擇對最終輸出影響最大的素材——無論是用於動作的參考影片,還是用於角色一致性的圖片。


如何使用參考素材

Seedance 2.0 採用 @ 提及系統來指定每個上傳素材的用途,讓你明確控制每個檔案對生成結果的貢獻。

入口模式

  • 首末幀模式:僅需起始圖片加提示詞時使用
  • 通用參考模式:用於多模態組合(圖片+影片+音頻+文字)

@ 語法

上傳檔案後,在提示詞中使用 @ 加上檔案識別碼來引用:

@Image1 作為第一幀,參考 @Video1 的鏡頭運動,
使用 @Audio1 作為背景音樂

參考指令範例

使用場景提示詞格式
設定第一幀@Image1 作為第一幀
參考動作參考 @Video1 的打鬥編排
複製鏡頭運動跟隨 @Video1 的鏡頭移動與轉場
添加音樂/節奏使用 @Audio1 作為背景音樂
延伸影片將 @Video1 延伸5秒
替換角色用 @Image1 替換 @Video1 中的女性

核心功能

1. 提升基礎生成品質

Seedance 2.0 在基礎生成品質上帶來顯著提升:

  • 物理精準度:物體按照真實世界規則下落、碰撞和互動
  • 流暢動作:自然的動作,具備適當的動量與節奏
  • 精準指令遵循:模型能理解並執行複雜提示詞
  • 風格一致性:在整個影片中保持視覺連貫性

範例提示詞:

一個女孩優雅地晾衣服,晾好一件後伸手從籃子裡拿出另一件,
用力抖開。

模型能處理連續動作、布料物理效果和自然的肢體動作,無需額外說明。

2. 多模態參考系統

這是 Seedance 2.0 的決定性功能。你幾乎可以參考上傳素材中的任何元素:

  • 來自參考影片的動作模式
  • 來自創意模板的視覺效果與轉場
  • 來自參考圖片的角色外觀
  • 來自電影示例的鏡頭技術
  • 來自音樂曲目的音頻節奏與氛圍

關鍵原則:用自然語言描述你想參考的內容。明確說明應從哪個檔案中提取哪個元素(動作、風格、鏡頭、角色)。

3. 角色與物件一致性

以往的模型難以在幀與幀之間保持身份一致性。Seedance 2.0 直接解決了這個問題:

  • 臉部一致性:角色在整個影片中保持其外觀
  • 產品細節保留:標誌、文字和精細細節保持準確
  • 場景連貫性:環境在各個鏡頭中保持一致
  • 風格鎖定:視覺風格在生成過程中不會漂移

範例提示詞:

男人 @Image1 下班後疲憊地回到家,走過走廊時放慢腳步,
在大門前停下。特寫他的臉,深吸一口氣,表情從緊繃轉為
放鬆。特寫他找到鑰匙,插入鎖孔。他推門而入,女兒和寵物
狗跑來擁抱他。室內溫馨舒適,全程有自然的對話。

4. 動作與鏡頭複製

上傳參考影片,Seedance 2.0 可以提取並應用:

  • 複雜編舞:打鬥場面、舞蹈動作、動作場景
  • 鏡頭技術:推軌鏡頭、跟蹤、吊臂運動、手持感
  • 剪輯節奏:剪輯時機、轉場風格、節奏
  • 特殊運動:希區柯克變焦、甩鏡、環繞鏡頭

範例提示詞:

參考 @Image1 中男性的外觀,場景設定在 @Image2 的電梯中。
完全複製 @Video1 的鏡頭運動和主角的面部表情。受到驚嚇時
使用希區柯克變焦,然後在電梯內進行多個環繞鏡頭。電梯門
打開,跟蹤鏡頭跟隨他出去。外景參考 @Image3,男子環顧四周。
參考 @Video1 的機械臂多角度跟蹤鏡頭,追蹤他的視線。

5. 創意模板複製

除了動作之外,你還可以複製完整的創意概念:

  • 廣告格式:產品展示、生活方式蒙太奇、品牌故事
  • 視覺效果:粒子系統、變形、風格化轉場
  • 電影技術:開場序列、片名字卡、戲劇性揭示
  • 剪輯風格:音樂影片剪輯、紀錄片節奏、商業片節奏

範例提示詞:

用 @Image1 中的女孩替換 @Video1 中的人物。用參考 @Image2
的天使替換月亮女神的CG。女孩蹲下時,背後長出翅膀。翅膀
掃過鏡頭形成轉場。參考 @Video1 的鏡頭運動和轉場。通過天使
的瞳孔進入下一個場景,天使俯瞰鏡頭(旋轉的翅膀與瞳孔相
呼應),鏡頭下降跟隨天使的臉,手臂抬起時拉遠鏡頭,露出
背景中的石天使雕像。全程一個連續鏡頭。

6. 影片延伸

在保持敘事連貫性的前提下延伸現有影片:

範例提示詞:

將 @Video1 延伸15秒。參考 @Image1 和 @Image2 中騎摩托車的
驢子角色。加入一段瘋狂的廣告片段:

場景一:側面鏡頭,驢子騎著摩托車衝破柵欄,附近的雞群
受驚四散。

場景二:驢子在沙地上進行旋轉特技,輪胎特寫,然後俯拍
驢子做圓圈動作,塵土飛揚。

場景三:山地背景,驢子從坡地飛躍而起,廣告文案通過遮罩
效果出現在身後(驢子經過時文字顯現):「激發創意,豐富
生活」。最終鏡頭:摩托車駛過,揚起一片塵雲。

7. 影片編輯

無需從頭重新生成即可修改現有影片:

  • 角色替換:在保持動作的同時將一個人換成另一個人
  • 元素添加/移除:添加物件、移除干擾元素
  • 風格遷移:應用新的視覺處理方式
  • 敘事改變:改變故事走向

範例提示詞:

顛覆 @Video1 的劇情。男人的表情瞬間從溫柔轉為冷酷無情。
在女人最意想不到的時刻,他將她推落橋下入水。推落動作果
決、蓄謀已久、毫不猶豫——完全顛覆了浪漫的人物設定。她
墜落時沒有尖叫,眼中只有難以置信。她浮出水面對他喊道:
「你從一開始就在騙我!」他站在橋上冷笑,輕聲說道:「這
是你家欠我家的。」

8. 音頻同步生成

Seedance 2.0 能生成帶有原生音頻的影片,並可與參考音頻同步:

  • 多語言口型同步對話
  • 與畫面動作匹配的音效
  • 跟隨視覺節奏的背景音樂
  • 帶有情感表達的配音

範例提示詞:

固定鏡頭。魚眼鏡頭從圓形開口向下俯視。參考 @Video1 的
魚眼效果。讓 @Video2 中的馬抬頭看向魚眼鏡頭。參考
@Video1 的說話動作。背景音頻參考 @Video3 的音效。

9. 節拍同步剪輯

創作與節拍完美契合的音樂影片風格內容:

範例提示詞:

海報中的女孩不斷更換服裝。服裝風格參考 @Image1 和
@Image2。她手持 @Image3 中的包包。影片節奏參考 @Video1。

多圖片與音樂同步:

@Image1 至 @Image7 根據 @Video1 的關鍵幀位置和整體節奏
進行剪輯。畫面中的人物更加動態。整體風格更加夢幻。視覺
衝擊力強。根據音樂和視覺流動需要調整參考圖片的取景。
鏡頭間加入燈光變化。

10. 單次連續長鏡頭

生成動作連貫的長鏡頭:

範例提示詞:

@Image1 至 @Image5,一個連續跟蹤鏡頭跟隨跑者上樓梯、
穿過走廊、到達屋頂,最後以城市俯瞰鏡頭結束。

範例提示詞:

諜戰風格。@Image1 作為第一幀。正面跟蹤鏡頭跟隨身穿紅色
大衣的女性向前走。全身跟蹤鏡頭。行人不斷遮擋畫面。她
走到一個街角,參考 @Image2 的街角建築。固定鏡頭,女性
走出畫面,消失在街角。一個戴面具的女孩在街角潛伏,惡意
地窺視,面具女孩的外觀參考 @Image3(僅外觀,她站在街角)。
鏡頭向前推進跟隨紅衣女性。她走進一棟豪宅後消失。豪宅
參考 @Image4。無剪輯。一個連續鏡頭。

創意應用

廣告與電商

創作帶有同步旁白、生活方式鏡頭和品牌故事的產品展示影片。多模態系統讓你在生成新內容的同時,能夠參考現有品牌素材。

內容本地化

生成帶有原生口型同步的多語言影片版本。參考原始影片的動作,同時用不同語言生成新的對話。

故事板轉影片

將靜態故事板轉換為動態序列。將你的分鏡板作為參考圖片上傳,並描述各幀之間的動作。

基於模板的創作

找到你喜歡的影片風格,將其作為參考上傳,然後用你自己的角色和場景生成該風格的新內容。


最佳實踐

  1. 明確說明參考用途:清楚寫明每個檔案的用途。「參考 @Video1 的鏡頭運動」比僅提及影片要好得多。

  2. 優先選擇素材:在12個檔案的限制下,選擇對輸出影響最大的素材。

  3. 核查 @ 提及:使用多個檔案時,仔細確認你沒有混淆哪張圖片、影片或音頻放在哪裡。

  4. 區分編輯與參考:明確說明你是要編輯現有影片,還是將其作為生成新內容的參考。

  5. 時長對齊:延伸影片時,將生成時長設置為與新增內容長度相符(例如延伸5秒 = 生成5秒)。

  6. 使用自然語言:模型能理解上下文。像向人類編輯描述需求一樣描述你想要的效果。


立即試用

Seedance 2.0 今日已在WaveSpeedAI上線。選擇適合你工作需求的版本:

上線九折優惠持續至5月13日(UTC+0)。瀏覽完整陣容請前往 Seedance 2.0 合集頁面

後續計劃

Seedance 2.0 的多模態功能持續演進。隨著新功能和輸入組合的上線,我們將即時更新本指南。

如果你遇到問題或有功能請求,歡迎提供反饋——這是我們讓工具對所有人更好用的方式。


特定場景需要更少的內容限制? 試試WaveSpeedAI上的這些替代方案:

WAN 2.7 | Veo 3.1 Fast T2V | Veo 3.1 Fast I2V | Sora 2 T2V | Sora 2 I2V | Kling | Vidu