什麼是Z-Image-Base?完整CFG控制對比Turbo速度

什麼是Z-Image-Base?完整CFG控制對比Turbo速度

你好,我是朵拉。最近我被一個小問題困擾著。我希望我的橫幅圖形停止以稍微…不對的方式出現。顏色會漂移。臉會顯得不自然。當我試圖修正一個問題時,另一個問題就會滑動。最後讓我感到小小摩擦的是:我無法調整結果,而不會打亂整個圖像的平衡。

所以,上週和本週一早(2026年2月),我嘗試了 Z-Image-Base 及其更快的兄弟 Z-Image-Turbo。我不是在追求速度。我想要更穩定的控制、表現良好的提示詞、能夠保持的調整,以及在不同運行之間更少的心理體操。

Z-Image-Base 是什麼?

Z-Image-Base 是一個 6B 參數的圖像生成模型,傾向於控制和可預測性而不是原始速度。如果 Turbo 感覺像短跑,Base 則感覺像帶著地圖的穩定漫步。當您嘗試匹配參考、保持品牌色彩一致或在一個視覺概念上反覆迭代而不失去思路時,它暴露了更多真正重要的旋鈕。

6B 參數架構概述

我不是在這裡崇拜參數計數,但 6B 的標記表明了一些簡單的事情:有足夠的容量來保持風格和結構,而不會因小變化而崩潰。實際上,在 2026 年 2 月 2-3 日進行測試時,我注意到兩件事:

  • 編輯堆疊得更乾淨。改變色溫或光照不會經常抹去構圖。
  • 種子在不同運行中表現更可預測。當我鎖定種子並調整引導強度時,場景會演變而不是重置。

它在引擎蓋下仍然是一個擴散風格的體驗:引導刻度、噪聲計劃和常見的步驟與種子舞蹈。如果您關心理論,這是 classifier-free guidance 發揮作用的地方。但對我來說重要的是:我的小提示詞改變感覺與輸出成正比。

與 Z-Image-Turbo 的關鍵區別

Turbo 更便宜且速度快。對於快速概念掃描、縮圖、情緒板、社交草稿來說非常好。但我不斷遇到同樣的問題:一旦我喜歡某些東西,獲得精確的變化(更溫暖的色調、更柔和的陰影、稍微更緊的裁剪)所花的時間超過應有的時間。

Base 給了我更好的控制。負面提示詞粘合效果更好、參考圖像在我要求時有更多的吸引力,CFG 調整感覺線性而不是跳躍。運行速度較慢,每張圖像成本更高,但在任何對保真度重要的任務上,更少的重試彌補了這一點。

Z-Image-Base 的核心功能

這些不是要記住的項目符號功能。它們是我發現自己在使用的槓桿,以及當我這樣做時發生的變化。

完整 CFG 支持

使用 Base​,引導表現得像調光器,而不是燈開關。較低的 CFG 讓模型探索,當提示詞感覺過於僵硬時很有用。較高的 CFG 將圖像拉近文本,但沒有我有時在較小或過度調整的模型中看到的脆弱、過度對比的外觀。

在實際運行中:我生成了一系列文章標題(「平靜的工作區、柔和的調色板、自然光、最少混亂」)。在 CFG 4–5,我得到了柔軟、大氣的結果,很好,但模糊。在 7–8,構圖鎖定了:桌子、窗光、乾淨的線條。在 10 以上,細節開始過度符合(刺眼的邊界、較少有機的光)。我的最佳位置在此風格周圍的 7.5 左右。

負面提示詞控制

這是 Base 贏得我信任的地方。當我要求「沒有鏡頭光暈、沒有光亮反射、沒有傾斜角度」時,模型實際上退縮了。使用 Turbo,如果主提示詞傾向於電影風格,這些說明有時會被忽略。

一個小例子:對於產品鏡頭模型,「沒有高光」加上「啞光裝飾」在 8 次運行中的 6 次中產生了一致的表面。不完美,但一致性足夠,我不需要手工修飾每個渲染。心理負荷下降,更少的微調整。

參考圖像引導

我使用了兩個參考:一個品牌色卡和一個來自過去設計的佈局框架。當我設置較高的參考權重時,Base 對兩者的尊重更強烈。顏色在與調色板相匹配的範圍內保持(不完全相同,但足以接近,我不需要重新繪製),構圖在框架內保持而不感覺僵硬。

有一個權衡。如果推動參考權重太遠,您會得到源的陳舊回聲。保持適度,您會獲得連續性而不會克隆。對我來說,當我需要品牌一致性時,0.35–0.55 感覺正確:0.15–0.25 當我只想要輕推時。

強度參數調整

稱其為去噪強度、圖像到圖像強度或只是「我們應該改變多少」,旋鈕很重要。使用 Base,中等強度編輯(在我的運行中約 0.45–0.6)保留了佈局,同時讓風格發展。這對「相同場景、不同情緒」很理想。

兩個突出的運行:

  • 我將正午照明柔和為晚午溫暖,而沒有失去對象位置。一個滑塊移動,一次運行,完成。
  • 我在保持主題遮罩完整性的同時將紋理背景交換為平坦背景,以至於我不需要重新拍攝輪廓。

這最初沒有為我節省時間,我擺弄了。但經過幾次通過後,我注意到它減少了重試並降低了心理努力。模型改變了我要求的內容,並保留了其餘的。

何時選擇 Base 與 Turbo

我花了一天時間在兩者之間切換以感受差異。選擇不是哲學性的:它是實用的。

選擇 Base:當細粒度控制很重要時

  • 您正在匹配品牌調色板或重複佈局,小偏差成本很高。
  • 您需要負面提示詞保持(沒有光亮反射、沒有極端景深、沒有傾斜地平線),因為清理時間會累加。
  • 您在多次運行中反覆迭代一個概念,不想在每次調整光照或顏色時重置構圖。

Base 沒有自己使圖像「更好」。它使更正保持。那是勝利。

選擇 Turbo:當速度是優先事項時

  • 您在探索方向、生成大量選項或快速故事板。
  • 您對粗糙度沒有問題,計劃稍後打磨小子集。
  • 成本是一個因素,您想首先廣撒網。

我現在的模式:從 Turbo 開始映射空間,一旦我發現值得保留的方向就移動到 Base。這是一個感覺理智的兩齒輪系統。

定價比較

價格變化,但這是我在 2026 年 2 月初測試期間使用的。

Base:$0.01/圖像

每張圖像一分錢,Base 不貴,但也不是拋棄式便宜。如果您在一個視覺上深入迭代,比如說 20–40 次運行,額外的控制通常會通過下游中更少的重做(更少的手動編輯、更少的重新開始)為自己付出代價。

Turbo:$0.005/圖像

一半的價格和明顯更快。非常適合生成 50–100 個粗製品以找到方向。如果您的工作流是「廣泛構思、狹隘優化」,Turbo 使第一階段負擔得起。

快速開始

如果您很好奇,想在不閱讀文檔的情況下感受差異,這是我會採取的路徑。

  1. 選擇一個有根據的提示詞。熟悉的東西,例如「柔和的光線桌子場景、柔和的顏色、天然木材、沒有混亂」。
  2. 在 Turbo 中運行 6–8 張圖像。注意您實際上會使用的一個。
  3. 切換到 Base,使用相同的種子(或接近的種子)。設置 CFG 7–8。
  4. 添加對您很重要的負面提示詞(沒有刺眼的陰影、沒有鏡頭光暈、沒有傾斜角度)。
  5. 如果您有參考、調色板或佈局,以適度的權重應用它(0.3–0.5)。
  6. 使用強度 ~0.5 進行第一次變化。在小步驟中向上或向下推。
  7. 保留改進的內容。撤銷對您不利的。不要追求完美:追求可重複性。

這對我有效,您的里程可能有所不同。差異出現的不是在單個「哇」圖像中,而是在我要求小型、無聊修復時模型如何響應。這是工具要麼老化良好要麼變大聲的地方。

最後一個說明:如果您想知道「Z-Image-Base 是什麼」超越規格,對我來說就是這樣,一個讓小決定保持的模型。我任何一天都會選擇那個而不是煙火。