如何在Seedance 2.0中保持角色一致性(參考包 + 規則)
使用參考包、嚴格約束條件和QA檢查清單來減少身份漂移,讓你知道下一步該調整什麼。
想要創作像 Seedance 2.0 一樣的電影級影片? 立即試用 WaveSpeed 電影級影片生成器,現在就能生成 Seedance 2.0 等級的電影影片。
我一開始並不是要解決身份漂移的問題。我只是希望同一個角色能在房間裡走兩次,而不會變成一個表親。第一遍看縮圖大小時還不錯。但仔細拉片後,我發現下顎線變柔和了,頭髮少了一個捲,到最後一秒眼睛的角度也不一樣了。說不上詭異,就是……有點不對勁。Seedance 2.0 速度快、能力強,但角色一致性正是它容易搖擺的地方。
我是 Dora。這個月我花了幾個深夜跑小型循環測試,記錄哪些方法有效。以下是當我把 Seedance 2.0 角色一致性擺在一切之上時,真正讓畫面穩定下來的方法,以及哪些沒用。

為什麼會發生 ID 漂移(模型「遺忘」了什麼)
Seedance 2.0 同時在做兩件事:保持可辨識的臉孔以及呈現有生命力的動作。當它必須二擇一時,往往選擇動作。ID 漂移就從這裡溜進來。
我一遍又一遍看到的現象:
- 它首先把握大輪廓(髮量、身高、整體體型)。
- 然後細部特徵在壓力下游走:眼距、人中長度、耳朵形狀、髮際線角落。在短片中,這通常出現在轉場和頭部轉動時。
- 光線變化就像是在悄悄修改身份。側光打下來,我的角色就變成了一個稍微不同的人。
就實際運作而言(我並非真的能看到模型權重):文字提示會傾向類別匹配(「年輕女性、捲髮短髮、牛仔外套」),而參考圖像則錨定具體的人。如果提示過度描述,類別就會勝出。如果參考圖像薄弱或不一致,模型就會對臉孔做「平均化」處理。
我還注意到模型在幾個可預期的地方「遺忘」:
- 當手遮住臉時,它會把下一幀當成一次小型重組。
- 快速橫轉會破壞耳朵與太陽穴的保真度。
- 帶有重複圖案的服裝紋理有時會把注意力從臉部特徵拉走。
所以漂移並非隨機的,而是從具體細節慢慢滲入類型化的過程。了解這一點改變了我準備輸入素材和撰寫提示的方式。如果你也在對抗細微的幀不穩定性,這份關於**修復 Seedance 2.0 閃爍與抖動**的簡短指南與身份控制相輔相成。
建立參考素材包(圖片+短片+風格錨點)
我最大的突破來自一個看似無聊的舉動:我建立了一個小而嚴謹的參考素材包。ByteDance 官方公告強調 Seedance 2.0「在指令遵循方面表現卓越,即便面對角色互動豐富的複雜故事,也能精確重現並保持穩定的主體一致性。」當我給 Seedance 2.0 更少但更清晰的錨點時,我的角色就更能保持完整。

以下是對我效果最好的做法:
- 最多三張靜態照,而非十張。 我選擇:一張正面、一張四分之三側臉、一張側面。同一次拍攝、同樣的光線。我避免一張在微笑、另一張表情中立——太多的表情變化會讓模型挑選一個折中的臉孔。
- 一段 2–3 秒的參考片段,包含中性的點頭或緩慢眨眼。 我剪掉空白幀,保持背景簡潔。這讓模型有了一個下顎和眼睛動作的動態基準線。
- 一個風格錨點:一張用來設定色調與對比的視覺素材。 我使用了之前喜歡的匯出畫面的靜幀。如果跳過這步,身份雖然保持,但氛圍會漂移;加上它之後,兩者都更接近原設定。
沒有幫助的做法:
- 拼貼圖。 對我來說看起來很整齊,但模型似乎把它當成一個繁雜的場景來處理。
- 混合光線。 我有一張溫暖的室內照和一張冷調的室外照:模型把它們平均成了中性色調,稍微改變了膚色和感知年齡。
- 只有高解析度大頭照。 奇怪的是,在兩張清晰照片中插入一張中等解析度的照片反而有幫助,也許是因為它軟化了對毛孔的過度擬合,同時保留了臉部輪廓。
我把這套素材包放在同一個資料夾中,使用簡單的命名(front.jpg、threequarter.jpg、profile.jpg、ref.mp4、look.jpg)。設置時間縮短到一分鐘,也不需要猶豫該放什麼。當我大量迭代時,這種減少心智摩擦的小動作非常重要。
穩定身份的提示規則(該固定什麼、該避免什麼)

我不再寫花俏的提示了。我越想讓模型印象深刻,它就越忽略我的人物,轉而追求美學效果。以下是讓我保持 Seedance 2.0 角色一致性的更低調做法。
我固定的內容:
- 把角色命名為單一實體,即便是虛構的:「與參考圖像相同的角色:一個一致的身份。」這聽起來多餘,但它讓模型不再去取樣「類型變體」。
- 鎖定年齡範圍、頭髮細節,以及對辨識度最重要的一兩個硬性特徵:「二十歲末,耳長位置有緊密的深色捲髮,左耳戴小銀環。」細節太少會讓它泛化;太多它又會挑著用。
- 鏡頭意圖和節奏:「緩慢的橫越畫面步行循環,表情微妙,不要大幅度轉頭。」動作的紀律就是身份的紀律。
我避免的內容:
- 與錨點衝突的模糊風格詞彙:「電影感」、「夢幻」、「粗獷」。如果需要某種質感,我用風格參考來設定,而不是用形容詞。
- 在片段中途改變剪影的服裝細節管理(圍巾、在風中飄動的寬鬆外套)。如果服裝必須具體,我讓它合身且靜止。
- 複雜的動作。每一個額外的節拍都是出現新臉孔的機會。我從簡單開始:走路、坐下、轉15度、眨眼。
兩個有幫助的措辭技巧:
「在所有幀中保持與參考圖像完全相同的面部比例。」聽起來很強硬,但大多數時候有效。
「不要新增飾品,不要改變妝容,頭髮只有自然飄動。」這些小開關填補了我沒想到要說明的奇怪漏洞。
跑了五次之後,我注意到一件小事:把提示縮短三分之一,輸出結果更接近目標。我的直覺是:更少的雜散 token 拉著模型走向氛圍自助餐。
重新跑之前的 QA 清單(臉孔、雙手、標誌、服裝)
以前我憑直覺重跑。現在我每次用同樣的清單做 60–90 秒的檢查。這避免了盲目重試,節省了時間。

臉孔
- 停在第 1 幀、中間點和最後一幀。與 front.jpg 比較眼距和下顎角度。如果兩者漂移超過「縮圖比例下一個像素寬度」,我就重跑。
- 慢速拉片觀察眨眼動作。如果眼皮邊緣在眨眼中途改變了厚度,身份就有風險。
雙手
- 檢查任何手遮住臉的時刻。如果臉重新出現時變得更瘦或鼻樑不同,我視為硬性失敗,而不是「也許還行」。
- 數手指瑕疵。一個故障往往預示著 10–15 幀後會出現第二次身份滑移。
標誌與小標記
- 如果襯衫上的小標誌翻轉或模糊,我預期臉部細節也會跟著搖晃。這是個好的早期警示。
- 痣或雀斑:如果它們位移了,我不在調色時修正,而是改固定輸入素材或動作。
服裝
- 圖案爬動(摩爾紋)會主導視覺注意力。如果看到它,我把上衣換成素色,或在風格錨點中調整曝光。
- 領口位移會以不同方式露出鎖骨,這可能微妙地改變感知到的臉部寬度。
我對每次輸出做鬆散評分:0(重跑)、1(可用於切換鏡頭)、2(足夠作為序列錨點)。如果我連續得到兩個「2」,就停止調整。不求完美,只要穩定到足以讓故事承載它。
漂移持續時的修復階梯(替換參考、收緊限制、縮短動作)

當在整理好輸入素材和仔細撰寫提示後身份仍然滑移,我停止猜測,開始按一個簡單的階梯往上爬。我一次嘗試一階,跑一個 2–3 秒的測試。
- 替換參考,而非全部重來
- 只替換側面照或四分之三照,換一張光線更接近的。其餘保持不變。全面替換會抹去我不易找回的進展。
- 如果表情有變化,將其標準化:所有靜態照片都用中性表情。我曾因一個大大的微笑把整個片段的臉頰體積撐寬。
- 用簡單白話收緊限制
- 每次跑一個限制:「頭部轉動不超過 10°」,然後「臉部無遮擋」,然後「頭髮緊貼頭部:不要飄動」。慢慢堆疊比一次全部丟進去效果更好。
- 如果模型跟你對抗,改用否定句:「避免大幅度轉頭:避免頭髮飄起:避免飾品改變。」否定句似乎被遵守得更嚴格。
- 縮短動作,然後重建
- 把動作視窗縮短到 1.5–2 秒,移除節拍:只是走路,只是一個眼神。一旦臉部保持穩定,再加回一個節拍。
- 對於循環,我避免完美的循環重疊:它可能在接縫處觸發臉孔「重置」。
- 降低視覺熵
- 簡化背景,並在風格錨點中稍微降低對比度。當場景變得更平靜時,Seedance 2.0 把更多「注意力」放在臉部上。
- 如果膚色在不同鏡頭間持續漂移,在錨點中稍微降低膚色飽和度。這似乎能抑制突然的冷暖色調切換。
- 最後手段:順應輪廓
- 如果獨特的下顎線無法保持,我就依靠髮型、耳飾和服裝版型。觀眾從遠處讀取身份的能力比我們承認的強得多。這不是作弊,這是剪輯。
在八次短片測試中,這個階梯讓我的重跑次數減少了約三分之一。更重要的是,它降低了心理雜訊。我不再覺得每次渲染都是在賭運氣。
適合哪些人:如果你比起花俏的攝影機運動,更在乎 Seedance 2.0 角色一致性,這條更慢、更穩定的路線對你來說應該很自然。如果你想要大幅度弧線、甩鏡或一氣呵成的表情獨白,你會很快碰到限制。但你仍然可以做到,只需要分層建構。
想要創作像 Seedance 2.0 一樣的電影級影片? 立即試用 WaveSpeed 電影級影片生成器,現在就能生成 Seedance 2.0 等級的電影影片。



