如何在Seedance 2.0中保持角色一致性（參考包 + 規則）

想要創作像 Seedance 2.0 一樣的電影級影片？ 立即試用 WaveSpeed 電影級影片生成器，現在就能生成 Seedance 2.0 等級的電影影片。

我一開始並不是要解決身份漂移的問題。我只是希望同一個角色能在房間裡走兩次，而不會變成一個表親。第一遍看縮圖大小時還不錯。但仔細拉片後，我發現下顎線變柔和了，頭髮少了一個捲，到最後一秒眼睛的角度也不一樣了。說不上詭異，就是……有點不對勁。Seedance 2.0 速度快、能力強，但角色一致性正是它容易搖擺的地方。

我是 Dora。這個月我花了幾個深夜跑小型循環測試，記錄哪些方法有效。以下是當我把 Seedance 2.0 角色一致性擺在一切之上時，真正讓畫面穩定下來的方法，以及哪些沒用。

為什麼會發生 ID 漂移（模型「遺忘」了什麼）

Seedance 2.0 同時在做兩件事：保持可辨識的臉孔以及呈現有生命力的動作。當它必須二擇一時，往往選擇動作。ID 漂移就從這裡溜進來。

我一遍又一遍看到的現象：

它首先把握大輪廓（髮量、身高、整體體型）。
然後細部特徵在壓力下游走：眼距、人中長度、耳朵形狀、髮際線角落。在短片中，這通常出現在轉場和頭部轉動時。
光線變化就像是在悄悄修改身份。側光打下來，我的角色就變成了一個稍微不同的人。

就實際運作而言（我並非真的能看到模型權重）：文字提示會傾向類別匹配（「年輕女性、捲髮短髮、牛仔外套」），而參考圖像則錨定具體的人。如果提示過度描述，類別就會勝出。如果參考圖像薄弱或不一致，模型就會對臉孔做「平均化」處理。

我還注意到模型在幾個可預期的地方「遺忘」：

當手遮住臉時，它會把下一幀當成一次小型重組。
快速橫轉會破壞耳朵與太陽穴的保真度。
帶有重複圖案的服裝紋理有時會把注意力從臉部特徵拉走。

所以漂移並非隨機的，而是從具體細節慢慢滲入類型化的過程。了解這一點改變了我準備輸入素材和撰寫提示的方式。如果你也在對抗細微的幀不穩定性，這份關於**修復 Seedance 2.0 閃爍與抖動**的簡短指南與身份控制相輔相成。

建立參考素材包（圖片＋短片＋風格錨點）

我最大的突破來自一個看似無聊的舉動：我建立了一個小而嚴謹的參考素材包。ByteDance 官方公告強調 Seedance 2.0「在指令遵循方面表現卓越，即便面對角色互動豐富的複雜故事，也能精確重現並保持穩定的主體一致性。」當我給 Seedance 2.0 更少但更清晰的錨點時，我的角色就更能保持完整。

以下是對我效果最好的做法：

最多三張靜態照，而非十張。 我選擇：一張正面、一張四分之三側臉、一張側面。同一次拍攝、同樣的光線。我避免一張在微笑、另一張表情中立——太多的表情變化會讓模型挑選一個折中的臉孔。
一段 2–3 秒的參考片段，包含中性的點頭或緩慢眨眼。 我剪掉空白幀，保持背景簡潔。這讓模型有了一個下顎和眼睛動作的動態基準線。
一個風格錨點：一張用來設定色調與對比的視覺素材。 我使用了之前喜歡的匯出畫面的靜幀。如果跳過這步，身份雖然保持，但氛圍會漂移；加上它之後，兩者都更接近原設定。

沒有幫助的做法：

拼貼圖。 對我來說看起來很整齊，但模型似乎把它當成一個繁雜的場景來處理。
混合光線。 我有一張溫暖的室內照和一張冷調的室外照：模型把它們平均成了中性色調，稍微改變了膚色和感知年齡。
只有高解析度大頭照。 奇怪的是，在兩張清晰照片中插入一張中等解析度的照片反而有幫助，也許是因為它軟化了對毛孔的過度擬合，同時保留了臉部輪廓。

我把這套素材包放在同一個資料夾中，使用簡單的命名（front.jpg、threequarter.jpg、profile.jpg、ref.mp4、look.jpg）。設置時間縮短到一分鐘，也不需要猶豫該放什麼。當我大量迭代時，這種減少心智摩擦的小動作非常重要。

穩定身份的提示規則（該固定什麼、該避免什麼）

我不再寫花俏的提示了。我越想讓模型印象深刻，它就越忽略我的人物，轉而追求美學效果。以下是讓我保持 Seedance 2.0 角色一致性的更低調做法。

我固定的內容：

把角色命名為單一實體，即便是虛構的：「與參考圖像相同的角色：一個一致的身份。」這聽起來多餘，但它讓模型不再去取樣「類型變體」。
鎖定年齡範圍、頭髮細節，以及對辨識度最重要的一兩個硬性特徵：「二十歲末，耳長位置有緊密的深色捲髮，左耳戴小銀環。」細節太少會讓它泛化；太多它又會挑著用。
鏡頭意圖和節奏：「緩慢的橫越畫面步行循環，表情微妙，不要大幅度轉頭。」動作的紀律就是身份的紀律。

我避免的內容：

與錨點衝突的模糊風格詞彙：「電影感」、「夢幻」、「粗獷」。如果需要某種質感，我用風格參考來設定，而不是用形容詞。
在片段中途改變剪影的服裝細節管理（圍巾、在風中飄動的寬鬆外套）。如果服裝必須具體，我讓它合身且靜止。
複雜的動作。每一個額外的節拍都是出現新臉孔的機會。我從簡單開始：走路、坐下、轉15度、眨眼。

兩個有幫助的措辭技巧：

「在所有幀中保持與參考圖像完全相同的面部比例。」聽起來很強硬，但大多數時候有效。

「不要新增飾品，不要改變妝容，頭髮只有自然飄動。」這些小開關填補了我沒想到要說明的奇怪漏洞。

跑了五次之後，我注意到一件小事：把提示縮短三分之一，輸出結果更接近目標。我的直覺是：更少的雜散 token 拉著模型走向氛圍自助餐。

重新跑之前的 QA 清單（臉孔、雙手、標誌、服裝）

以前我憑直覺重跑。現在我每次用同樣的清單做 60–90 秒的檢查。這避免了盲目重試，節省了時間。

臉孔

停在第 1 幀、中間點和最後一幀。與 front.jpg 比較眼距和下顎角度。如果兩者漂移超過「縮圖比例下一個像素寬度」，我就重跑。
慢速拉片觀察眨眼動作。如果眼皮邊緣在眨眼中途改變了厚度，身份就有風險。

雙手

檢查任何手遮住臉的時刻。如果臉重新出現時變得更瘦或鼻樑不同，我視為硬性失敗，而不是「也許還行」。
數手指瑕疵。一個故障往往預示著 10–15 幀後會出現第二次身份滑移。

標誌與小標記

如果襯衫上的小標誌翻轉或模糊，我預期臉部細節也會跟著搖晃。這是個好的早期警示。
痣或雀斑：如果它們位移了，我不在調色時修正，而是改固定輸入素材或動作。

服裝

圖案爬動（摩爾紋）會主導視覺注意力。如果看到它，我把上衣換成素色，或在風格錨點中調整曝光。
領口位移會以不同方式露出鎖骨，這可能微妙地改變感知到的臉部寬度。

我對每次輸出做鬆散評分：0（重跑）、1（可用於切換鏡頭）、2（足夠作為序列錨點）。如果我連續得到兩個「2」，就停止調整。不求完美，只要穩定到足以讓故事承載它。

漂移持續時的修復階梯（替換參考、收緊限制、縮短動作）

當在整理好輸入素材和仔細撰寫提示後身份仍然滑移，我停止猜測，開始按一個簡單的階梯往上爬。我一次嘗試一階，跑一個 2–3 秒的測試。

替換參考，而非全部重來

只替換側面照或四分之三照，換一張光線更接近的。其餘保持不變。全面替換會抹去我不易找回的進展。
如果表情有變化，將其標準化：所有靜態照片都用中性表情。我曾因一個大大的微笑把整個片段的臉頰體積撐寬。

用簡單白話收緊限制

每次跑一個限制：「頭部轉動不超過 10°」，然後「臉部無遮擋」，然後「頭髮緊貼頭部：不要飄動」。慢慢堆疊比一次全部丟進去效果更好。
如果模型跟你對抗，改用否定句：「避免大幅度轉頭：避免頭髮飄起：避免飾品改變。」否定句似乎被遵守得更嚴格。

縮短動作，然後重建

把動作視窗縮短到 1.5–2 秒，移除節拍：只是走路，只是一個眼神。一旦臉部保持穩定，再加回一個節拍。
對於循環，我避免完美的循環重疊：它可能在接縫處觸發臉孔「重置」。

降低視覺熵

簡化背景，並在風格錨點中稍微降低對比度。當場景變得更平靜時，Seedance 2.0 把更多「注意力」放在臉部上。
如果膚色在不同鏡頭間持續漂移，在錨點中稍微降低膚色飽和度。這似乎能抑制突然的冷暖色調切換。

最後手段：順應輪廓

如果獨特的下顎線無法保持，我就依靠髮型、耳飾和服裝版型。觀眾從遠處讀取身份的能力比我們承認的強得多。這不是作弊，這是剪輯。

在八次短片測試中，這個階梯讓我的重跑次數減少了約三分之一。更重要的是，它降低了心理雜訊。我不再覺得每次渲染都是在賭運氣。

適合哪些人：如果你比起花俏的攝影機運動，更在乎 Seedance 2.0 角色一致性，這條更慢、更穩定的路線對你來說應該很自然。如果你想要大幅度弧線、甩鏡或一氣呵成的表情獨白，你會很快碰到限制。但你仍然可以做到，只需要分層建構。

想要創作像 Seedance 2.0 一樣的電影級影片？ 立即試用 WaveSpeed 電影級影片生成器，現在就能生成 Seedance 2.0 等級的電影影片。

為什麼會發生 ID 漂移（模型「遺忘」了什麼）

建立參考素材包（圖片＋短片＋風格錨點）

穩定身份的提示規則（該固定什麼、該避免什麼）

重新跑之前的 QA 清單（臉孔、雙手、標誌、服裝）

漂移持續時的修復階梯（替換參考、收緊限制、縮短動作）

相關文章

Claude Code 原始碼洩露：BUDDY、KAIROS 及所有隱藏功能完整解析

什麼是Claude Mythos？洩露資訊、Capybara等級及Anthropic的官方確認

什麼是 Claw Code？Claude Code 重寫解析

什麼是Qwen3.5-Omni：功能、版本與API存取

PixVerse V6 Extend 現已登陸WaveSpeedAI

PixVerse V6 Image-to-Video現已登陸WaveSpeedAI