Z-Image CFG 設置指南:避免過飽和與過曝問題
Z-Image-Base CFG(guidance_scale)的最佳設置:建議範圍為 3.5 至 6。過高的 CFG 會導致過飽和問題。不同風格對 CFG 有不同的建議值。
這週,我一直在生成讓我覺得有點……太喧鬧的圖片。色彩過於鮮豔,高光爆掉,整體氛圍和我的提示詞不符,即使主體本身是對的。這個小小的摩擦讓我下定決心,端著咖啡坐下來,對 Z-Image-Base 做一系列安靜的測試——相同的提示詞、相同的種子、不同的 CFG 值——直到這些規律在我腦海中變得清晰明顯。
我是 Dora。這份 Z-Image CFG 設定指南,是那些測試跑下來的結果,加上過去使用擴散模型的筆記。我不是要向你推銷某個設定值。我是要讓你看到我的轉變、為什麼它可能發生,以及一個小小的調整如何能讓工作變得輕鬆而非喧囂。

什麼是 CFG
CFG 對圖像生成的影響
Classifier-Free Guidance(CFG)是一個旋鈕,決定模型應該多強烈地遵循你的提示詞,還是依賴它自身學到的先驗知識。低 CFG 讓模型自由遊走;高 CFG 則把它拉向你的文字。實際上,它沒有聽起來那麼神秘。我把它想像成一位導演給演員意見:「放鬆一點」或「照著劇本來」。
當我對相同的提示詞(「柔和的晨光、木桌上的陶瓷馬克杯、淺景深」)將 CFG 從 1 掃到 9,變化是一致的:
- 低 CFG(1–3):氛圍更多變、對比更柔和、質感更出乎意料。有時馬克杯變成了陶器,或者光線偏冷。並不是錯的,只是更具詮釋性。
- 中 CFG(3.5–6):圖像穩定下來,構圖維持住,細節和提示詞吻合,卻不會變得死板。這個範圍讓我如釋重負。
- 高 CFG(7+):主體符合度依然高,但色彩飽和度和微對比度急劇上升。高光更容易爆掉。乍看之下很有衝擊力,然後讓人覺得疲倦。
如果你想要一個正式的參考,Jonathan Ho 和 Tim Salimans 的原始 Classifier-Free Guidance 論文解釋了這個機制:CFG 通過縮放條件預測和無條件預測之間的差異,來在樣本忠實度和多樣性之間進行取捨。

CFG 值與提示詞符合度的關係
更高的 CFG 會提升提示詞符合度,但有所取捨:
- 它無法修正模糊的提示詞。在 CFG 8 下,一個含糊的提示詞依然含糊,只是更吵。
- 它可能強迫字面解讀,與風格產生衝突。在高引導值下,即使我沒有要求,「光澤感」也會悄悄出現——就像模型過度咬字發音。
- 它與負面提示詞互動。「不要爆掉的高光、不要過度飽和」略微緩衝了高 CFG,但效果遠不如直接降低數值。
我的結論:用 CFG 來「微調」一個好的提示詞,而不是去拯救一個薄弱的提示詞。最佳點通常是符合度上升、但色彩和光線還沒有變得戲劇化的那個位置。
Z-Image-Base CFG 推薦範圍

低 CFG(1–3):更隨機、更有創意
當我在 Z-Image-Base 上使用 CFG 2 時,我得到了令人愉悅、幾乎帶著電影感的柔和質感。邊緣不那麼生硬,細小的瑕疵融入顆粒感,而不是塑膠光澤。這個範圍適合:
- 氛圍主導的場景:霧氣、黃昏、散景、水彩風格的渲染。
- 早期構想:我想要各種可能性,而不是精確度。低 CFG 從一個種子給了我三個可信的方向。
我遇到的限制:
- 構圖漂移:道具位置游移,取景偏移,手部變得不穩定。
- 提示詞中的具體細節(品牌、物體數量)容易丟失。
如果你在進行靈感版的探索或視覺語言的研究,低 CFG 溫和而富有生成性。如果你有截止日期需要符合某個簡報,它可能太鬆散了。
中 CFG(3.5–6):平衡點(推薦 4.5)
這是我測試中最可靠的區間。在 4.5 時,Z-Image-Base 感覺很配合,而不會變得光滑油膩。一些實地筆記:
- 色彩沉穩下來。膚色不再偏向螢光。木頭看起來像木頭,而不是亮漆。
- 光線保持表現力,但不會爆掉。白襯衫保留了質感。
- 提示詞保持形態:如果我要求「兩個杯子」,大多數時候我得到的就是兩個杯子。
我為什麼推薦 4.5 作為起點:
- 它捕捉了提示詞的意圖,同時為風格留有餘地。
- 它與小型負面提示詞配合良好(例如「過度飽和、塑膠光澤」)。
- 在每個提示詞六個種子的情況下,變化保持有用,而不是混亂。
邊緣情況:
- 非常技術性的產品渲染有時需要稍微高一點(5–5.5)才能把邊緣做好。
- 繪畫感質感在這裡效果不錯,但有時在 3.5–4 時綻放得更好。
高 CFG(7+):過度飽和的風險
我把 7–9 推到極限,看看東西在哪裡崩潰。它們沒有崩潰,但開始大聲喧嚷。
- 飽和度以一種能搶眼縮圖、卻在實際使用中讓人疲倦的方式飆升。
- 高光鏡面反射變得刺眼。金屬質感過於閃亮,皮膚變得蠟質。
- 平坦區域出現噪點,就像模型太用力了。
高 CFG 有什麼用處嗎?有幾個:
- 縮圖優先的素材,視覺衝擊力比細膩感更重要。
- 嚴格的品牌限制,如果你同時在後製中控制色彩並注意曝光的話。
但如果你遇到「塑膠效果」或無法在後製中調整的強烈溢色,先降低數值,不要堆砌一個又一個的修補方案。在我的測試中,從 7.5 降到 5 解決的問題,比任何負面提示詞清單都要多。
常見問題診斷
圖像過度飽和 / 色彩過於鮮豔
我看到的情況:紅色和青色猛烈穿透,漸層出現色帶,整張圖片感覺像過度HDR處理。
可能的原因:CFG 推得太強,有時結合了偏向高對比的採樣器。
有幫助的做法:
- 先將 CFG 降低 1–2 點。簡單的勝利。
- 加入輕微的負面提示詞:「過度飽和、色彩剪切」。它能微調,但不能取代 CFG 的改變。
- 如果可以,減少偏對比的後製處理,或切換到更好保留中間調的採樣器。
與實際工作的聯繫:素材開始能更好地與頁面上的真實照片並排放置。我不再需要在後製中費力調整色彩。
圖像過曝 / 高光溢出
我看到的情況:白襯衫失去紋理;窗戶發光得像傳送門。直方圖堆積在右側。
可能的原因:高 CFG 加上「明亮」或「陽光照射」的提示詞,而沒有任何約束條件。
有幫助的做法:
- 將 CFG 降至 4–5 範圍。
- 明確說明:「柔和的漫射光」、「保留高光細節」,或「不要爆掉的高光」。
- 通過提示詞微調曝光(「陰天」的效果比我預期的要好)。如果工具允許,稍微在其他地方降低曝光/對比,而不是單靠引導值來對抗。
結果:高光鏡面反射保留了,但有了質感。圖像讀起來更像是相機拍的,而不是展示間渲染圖。
細節丟失 / 塑膠效果
我看到的情況:皮膚看起來蠟質,布料變成了平滑的漸層,微觀質感消失了。
可能的原因:高 CFG 與「光澤」、「電影感照明」或「超高細節」等風格詞彙的組合,反而悖論式地使表面變得平坦。
有幫助的做法:
- 將 CFG 降至約 4.5。
- 將「超高細節」替換為具體的質感提示:「細緻的亞麻布紋」、「細微的毛孔」、「啞光質感」。
- 加入負面提示詞,如「塑膠感、蠟質、磨皮過度」。
實際效果:這在第一輪並沒有為我節省時間,但幾張圖片之後,我注意到它減少了心理負擔。減少了重新生成的次數。減少了「為什麼這看起來很假?」的時刻。
不同風格的 CFG 建議
寫實攝影:CFG 4–5
對於逼真的照片風格提示詞,4–5 感覺最接近「設定好就不用管了」。我在人像、桌面場景和簡單食物拍攝上使用了這個範圍。在 4.5 時,皮膚質感保留住,陰影沒有被壓死,鏡頭感覺真實可信。
有幫助的微調:
- 像人一樣要求光線:「窗光、朝北、陰天」。
- 使用少量負面提示詞:「過度飽和、塑膠皮膚」。
- 保持構圖詞彙簡單:「35mm、f/2.8、半身」。過於華麗的提示詞會把風格推得太強,與寫實感產生衝突。
適合的人群:將生成圖像與真實攝影混合使用的行銷人員和創作者。它可以融入品牌頁面,而不顯得突兀。
插畫風格:CFG 5–7
插畫風格喜歡多一點的引導。在 5.5–6.5 時,線條保持一致,色盤有意圖感,而不會變成霓虹色。
有幫助的微調:
- 對媒介要具體:「水粉暈染」、「墨線勾勒」、「網版印刷質感」。引導值然後會鎖定在那個概念上。
- 如果色彩過於喧鬧,降低 CFG 並錨定調色盤提示(「靜謐的大地色調」、「有限色盤」)。
- 對於概念設計圖,可以低至 3.5,以鼓勵跨幀的變化。
適合的人群:建立一致視覺系統的團隊,如應用程式、文件或教育材料——在這些場景中,風格的一致性比逼真的效果更重要。
CFG 與其他參數的配合
CFG 並不是單獨工作的。我注意到幾個持續出現的互動關係:
- 採樣器和步數:增加步數有時能軟化高 CFG 的瑕疵,但效果不夠顯著,不值得花費額外時間。降低 CFG 比增加步數帶來更好的回報。
- 解析度:在高 CFG 下放大尺寸會加劇塑膠光澤。當我需要大尺寸輸出時,我保持 CFG 在中等水平(約 4.5),讓獨立的放大工具來處理細節。
- 負面提示詞:它們是調味料,不是救援工具。一個小而有針對性的清單效果最好:「過度飽和、蠟質皮膚、爆掉的高光」。長長的一串清單反而會讓圖像變得沉悶。
- 風格標記:如果你加入了強烈的風格提示(「棚拍閃燈、光滑雜誌感」),預期它們會放大高 CFG 的衝擊力。要麼軟化風格語言,要麼降低 CFG。
- 種子和變化:在 4.5 下跑三個種子,比在 7 下跑一個種子給了我更多可用的選項。前者感覺像是選擇;後者感覺像是在不斷糾正。
如果你想深入了解原因,擴散模型中的 Classifier-Free Guidance 方法有效地縮放了條件預測和無條件預測之間的差異。把它推得太遠,你不僅放大了信號,也放大了噪點和偏向高對比表現的偏差。好的入門資源:原始的 Classifier-Free Guidance 論文,以及 Diffusers 中的 guidance_scale 說明。它們與我的觀察吻合——用引導來引導,而不是強迫。
這一切歸結為我現在遵循的一個小實踐:從 CFG 4.5 開始,跑兩個種子,只有在我能說出問題所在(太亮、太光滑、太模糊)的時候才移動旋鈕。這是安靜的工作,但它讓我免於之後與模型搏鬥。如果你正在將其接入工作流程或 API 管線,這份簡短的 Z-Image-Base API 指南展示了 guidance_scale 的位置以及如何乾淨地傳入它。





