什么是Z-Image-Base?完整CFG控制 vs 涡轮速度
你好,我是Dora。最近有个小事一直困扰着我。我希望我的横幅图形能停止出现一些…不对劲的情况。颜色会漂移。脸部看起来诡异。当我尝试修正一件事时,其他东西又会滑动。最后让我真正感到烦恼的是:我无法微调结果而不让整个图像失去平衡。
所以,上周和这周一早上(2026年2月),我试用了Z-Image-Base及其更快的兄弟版本Z-Image-Turbo。我不是在追求速度。我想要更稳定的控制,提示词能按我的意图运行,调整能保持住,运行之间的心智负荷更低。
Z-Image-Base是什么?
Z-Image-Base是一个60亿参数的图像生成模型,它更强调控制和可预测性而不是原始速度。如果Turbo像是短跑,Base就像是拿着地图稳步行走。当你试图匹配参考、保持品牌色彩一致或在一个视觉概念上迭代而不失去方向时,它暴露了更多真正重要的调整旋钮。
60亿参数架构概览
我不是来膜拜参数数量的,但60亿这个数字表明了某种简单的事实:足够的容量来保持风格和结构,即使发生微小变化也不会崩溃。在2026年2月2日至3日的测试中,我注意到两件事:
- 编辑叠加得更干净。改变色温或照明不会像之前那样经常抹掉构图。
- 种子在运行间表现得更可预测。当我锁定种子并调整引导强度时,场景会演变而不是重置。
从底层来看,它仍然是一种扩散式体验:引导尺度、噪声计划和通常的步数和种子之舞。如果你关心理论,这是分类器自由引导发挥作用的地方。但对我来说重要的是:我的小提示词改变与输出的关系显得成比例。
与Z-Image-Turbo的关键区别
Turbo更便宜更快。它很适合快速概念扫描、缩略图、情绪板、社交草稿。但我一直撞到同样的墙:一旦我喜欢什么,获得精确的变体(更温暖的色调、更柔和的阴影、略微更紧密的裁剪)比它应该花的时间要长。
Base给了我更精细的控制。反向提示词能更好地坚持,参考图像在我要求时有更大的拉力,CFG调整感觉是线性的而不是跳跃的。运行更慢,每张图像的成本也更高,是的,但在任何关乎保真度的任务上,更少的重试弥补了这一点。
Z-Image-Base的核心能力
这些不是要死记硬背的要点特性。它们是我发现自己在使用的杠杆,以及我用它们时改变的东西。
完整的CFG支持
使用Base,引导表现得像一个调光器,而不是开关。较低的CFG让模型自由探索,当提示词感觉太僵硬时很有用。较高的CFG将图像拉近到文本,但没有我有时在较小或过度调整的模型中看到的那种脆弱、过度对比的外观。
在实际操作中:我生成了一系列文章标题(“平静的工作空间,柔和的调色板,自然光,最小杂乱”)。在CFG 4–5时,我得到了柔和、富有氛围的结果,很好,但很模糊。在7–8时,构图锁定了:桌子、窗户光线、干净的线条。超过10,细节开始过度符合(刺眼的边缘,不那么有机的光线)。我的最佳点稳定在这种风格的7.5左右。
反向提示词控制
这是Base赢得我信任的地方。当我要求”没有镜头光晕,没有光泽反射,没有倾斜角度”时,模型确实退缩了。用Turbo时,如果主提示词倾向电影化,这些注释有时会被忽视。
一个小例子:对于产品展示模型,“没有镜面高光”加上”哑光效果”在8次运行中的6次产生了一致的表面。不完美,但足够一致,我不需要手工修复每个渲染。心智负荷下降了,更少的微调。
参考图像引导
我使用了两个参考:品牌色卡和过去设计的布局框架。当我设置更高的参考权重时,Base更强烈地尊重两者。颜色在与调色板匹配的范围内保持(不是精确的,但足够接近,我不需要重新绘制),构图保持在框架内而不感觉僵硬。
有一个权衡。将参考权重推得太远,你会得到源的陈旧回声。保持适度,你获得连续性而不克隆。对我来说,0.35–0.55在我需要品牌一致性时感觉是对的:0.15–0.25当我只想要一个轻推时。
强度参数调优
叫它反噪声强度、图像到图像强度或只是”我们应该改变多少”,这个旋钮很重要。使用Base,中等强度编辑(在我的运行中约0.45–0.6)保留了布局,同时让风格演变。这对”同样的场景,不同的心情”是理想的。
两次突出的运行:
- 我将正午照明柔和为晚午温暖,而不失物体位置。一个滑块移动,一次运行,完成。
- 我交换了纹理背景为平坦背景,同时保持主体蒙版足够完整,我不需要重新拍摄轮廓。
这一开始没有为我节省时间,我在摆弄。但在几次传递后,我注意到它减少了重试并降低了心智负荷。模型改变了我要求的东西,留下了其余部分。
何时选择Base vs Turbo
我在一整天之间切换两者来感受差异。选择不是哲学问题:它是实际问题。
选择Base:当细粒度控制很重要时
- 你在匹配品牌调色板或循环布局,小偏差代价很高。
- 你需要反向提示词坚持(没有光泽反射、没有极端景深、没有倾斜地平线),因为清理时间累积。
- 你在多次运行中迭代一个概念,不想在每次调整照明或颜色时重置构图。
Base本身没有使图像”更好”。它使修正保持。那是胜利。
选择Turbo:当速度是优先级时
- 你在探索方向、生成大量选项或快速故事板。
- 你对粗糙度没有意见,计划稍后打磨一小部分。
- 成本是一个因素,你想先投下广大网络。
我现在的模式:从Turbo开始映射空间,一旦我发现值得保留的方向就移动到Base。这是一个感觉理性的两档系统。
价格对比
价格会变化,但这是我在2026年初测试期间使用的。
Base:$0.01/图像
按每张图像一分钱,Base不贵,但也不是一次性便宜。如果你深度迭代一个视觉,比如20–40次运行,额外的控制通常在下游更少的返工中为自己付费(更少手工编辑、更少重新启动)。
Turbo:$0.005/图像
半价且明显更快。非常适合生成50–100个粗版本来找到方向。如果你的工作流是”宽范围构思,窄范围精细化”,Turbo让第一阶段保持可负担。
快速入门
如果你很好奇并想感受差异而不读文档,这是我会采取的路径。
- 选一个扎根的提示词。什么熟悉的,比如”柔光书桌场景,柔和颜色,天然木,无杂乱”。
- 在Turbo中运行6–8张图像。注意一个你实际会使用的。
- 用同样的种子(或接近的种子)切换到Base。设置CFG 7–8。
- 添加对你重要的反向提示词(没有刺眼阴影、没有镜头光晕、没有倾斜角度)。
- 如果你有参考、调色板或布局,用适度权重应用它(0.3–0.5)。
- 使用强度~0.5以首次变体。在小步中上下推。
- 保留改进的。撤销与你对抗的。不要追求完美:追求可重复性。
这对我有效,你的经历可能不同。差异不会在单一的”哇”图像中出现,而是在模型回应我请求小的、无聊的修正时的表现中出现。这是工具要么老化得很好要么变得吵闹的地方。
最后一个注意事项:如果你想知道”Z-Image-Base是什么”超越规格,对我来说它就是这个,一个让小决定坚持的模型。我会选择那个而不是烟火任何一天。





