← 博客

Z-Image-Turbo 图生图指南:强度参数深度解析

掌握 Z-Image-Turbo 图生图 API。了解强度参数(0-1)如何控制从细微增强到完全重构的图像变换过程,附代码示例。

2 min read
Z-Image-Turbo 图生图指南:强度参数深度解析

一月底,我正在为一份时事通讯修整一批头图。构图相同,只是不同周期的版本。我一遍遍把文件拖进 Photoshop 做微调——这里提亮一点,调一下对比度,保持整体氛围。这感觉……比它应有的复杂程度沉重多了。

我是 Dora。正是在那时,我重新审视了 Z-Image-Turbo图生图流程。并不是因为它流行,而是因为我想找到一种稳定、低摩擦的方式来刷新图片,而不是从头重做。整个二月,我已经多次使用它——用于轻度增强、风格迁移,以及一些以有趣方式走偏的实验。以下是真正帮到我的地方、没用的地方,以及”强度”参数如何成为整件事悄然核心的过程。

什么是图生图生成?

图生图以一张已有的图片为输入,引导模型生成一张新图。目标不是凭空想象出全新的场景,而是保留有用的结构(构图、主体、布局),同时改变你要求改变的部分——光线、风格、小幅修正,或大幅重新诠释。

使用 Z-Image-Turbo,这就像是你的输入图片与文字提示词之间的一场对话。图片说”这是锚点”,提示词说”往这个方向推”。你还可以设置强度值,决定模型应在多大程度上参考原图。在实践中,这一个值就掌控着整个体验。

我使用它的原因:

  • 降低心理负担。我不需要每次想换个新风格就重新思考构图或排版。
  • 适合批量工作流。一组提示词加上一张基准图,可以产出风格一致的变体。
  • 帮我保持诚实。如果我想把一张差照片修成好照片,模型会让我看清基础质量本身就不够。

关于预期的一点说明: 图生图并不是一键”变完美”的工具。它更像一个善于领会氛围、而非精确执行规格的得力助手。输入和约束条件越清晰,结果就越好。

强度参数详解

如果只调一个参数,就调强度。2026 年 2 月,我在真实工作素材上测试了各个范围——横幅图、产品样机和一些插画风格的头图。以下是各范围在我这里的实际表现。

0.0–0.3,增强模式

这个范围几乎保持原图不变。我用它来做:

  • 光线与对比度打磨,
  • 轻度清理(柔化噪点、平滑色带),
  • 克制的放大处理。

我注意到的: 提示词仍然有效,但作用像是轻微的推动。“更柔和的晨光”会改变色调,而不会重塑物体。人脸、标志和文字位置保持稳定。如果原图清晰且曝光准确,这个范围能很好地保留它。如果原图质量差,它不会将其救活——只会给你一个更干净的相同问题版本。

摩擦点:如果我要求特定的调色(比如青色高光),而基础图与之相抗,结果会停在中间。尚可接受,但并不精确。

0.3–0.6,平衡变换

这是我”让它感觉不同,但保留骨架”时的默认选择。布局保持可辨识。材质和光线的变化更有把握。

适合的场景:

  • 符合品牌调性的重新配色,
  • 同一张主图的季节性变体,
  • 从轻度写实向插画风格倾斜。

出乎我意料的地方: 文字容易漂移。如果图片中有实时文字,我要么在运行前将其遮罩去除,要么计划之后重新添加。另外,如果你的提示词暗示一种细节不同的风格,细小的配饰(耳环、小按钮)有时会变形。

0.6–0.8,风格迁移

在这里,模型会采取更大的自由度。我用它来做:

  • 绘画感或图形感的重新诠释,
  • 对来源不一的图片进行一致的美术方向统一,
  • 当我有布局但没有视觉感受时,用于情绪板制作。

观察结果:

  • 人脸可能会变得风格化;手的处理效果因所要求的风格而好坏不一。
  • 光线方向可能会随提示词的氛围而改变(例如”暗黑轮廓光”)。
  • 边缘会柔化。如果你需要像素级精确的产品边缘,请计划做后期处理或提前备好蒙版。

0.8–1.0,创意重构

这几乎是一种重混。模型会参考大致构图,但可以自由地重新设计元素。

当我卡住时,我会选这个范围。如果一张主图感觉平淡,我会用更大胆的提示词把强度推到 0.9,看看它能给出什么方向。有一半时候结果不可用;另一半则给了我一个自己不会尝试的方向。

局限性:品牌关键元素(标志、特定服装、受限制的产品细节)可能会改变或消失。如果你必须保护它们,不要用这么高的强度,或者在运行前将这些区域单独分割出去。

API 实现

我把 Z-Image-Turbo 接入了小型脚本,这样我就可以批量运行并将设置纳入版本控制。基础部分很简单:发送输入图片、提示词、强度值,以及你的账户支持的任何质量控制参数(尺寸、步数、引导、种子)。

来自实践的两个小提醒:

  • 保持参考图片干净,尺寸合理。我通常在长边 1024–1536 像素之间工作。
  • 将元数据与输出结果一起保存(提示词、强度、种子、日期)。当某张图效果很好而你想重现时,这会帮你省很多事。

必需参数

这些参数覆盖了我 90% 的运行情况:

  • image:源图片(文件上传或 URL)。使用高质量 PNG 或高码率 JPEG。
  • prompt:简短、平实的语言比华丽的描述更有效。
  • strength:0.0–1.0。越低越保留原图,越高越自由发挥。
  • sizewidth/height:提前决定好;如果一致性很重要,不要依赖默认值。

我常用的可选控制参数:

  • seed:固定随机性以便复现结果。
  • steps / quality:步数越多通常细节越精细,但耗时也越长。根据 Z-Image 官方文档,Z-Image-Turbo 仅需 8–9 步即可达到高质量,速度极快。
  • guidance / cfg:模型对提示词的遵从程度。
  • output_format:png 或 jpg,取决于你的工作流。

请查阅官方文档获取准确的参数名称和当前限制:服务商总喜欢在你毫无准备时重命名参数。

Python 代码示例

这是我随手备用的小脚本。有意写得简洁。将 ENDPOINT 和 AUTH_TOKEN 替换为你的实际值。

import base64

import json

import requests

from pathlib import Path


ENDPOINT = "<YOUR_IMAGE_TO_IMAGE_ENDPOINT>" # 例如,服务商 URL

AUTH_TOKEN = "<YOUR_API_KEY>"



def run_image_to_image(

input_path: str,

prompt: str,

strength: float = 0.45,

width: int = 1024,

height: int = 1024,

seed: int | None = None,


guidance: float = 3.5,

steps: int = 28,

output_path: str = "output.png",

):
# 将图片读取为 base64,避免 URL 相关问题

img_bytes = Path(input_path).read_bytes()

img_b64 = base64.b64encode(img_bytes).decode("utf-8")


payload = {

"model": "z-image-turbo", # 如果你的服务商需要指定模型名称

"image": {"type": "base64", "data": img_b64},

"prompt": prompt,

"strength": strength,

"width": width,

"height": height,

"guidance": guidance,

"steps": steps,

}

if seed is not None:

payload["seed"] = seed


headers = {

"Authorization": f"Bearer {AUTH_TOKEN}",

"Content-Type": "application/json",

}


r = requests.post(ENDPOINT, headers=headers, data=json.dumps(payload), timeout=120)

r.raise_for_status()

data = r.json()

# 响应中预期为 base64 或 URL:两种情况均处理

if "image_base64" in data:

out = base64.b64decode(data["image_base64"])

Path(output_path).write_bytes(out)

elif "image_url" in data:

img = requests.get(data["image_url"], timeout=120)

img.raise_for_status()

Path(output_path).write_bytes(img.content)

else:

raise RuntimeError("No image in response")


return output_path



if __name__ == "__main__":

out = run_image_to_image(

input_path="input.png",

prompt="softer morning light, subtle warm highlights, clean contrast",

strength=0.35,

width=1280,

height=720,

seed=1234,

)

print("Saved:", out)

处理图片 URL

使用 base64 上传比远程 URL 遇到的失败更少。当我确实使用 URL 时:

  • 确保它们可公开访问(运行过程中不要使用会过期的签名链接)。
  • 优先使用 HTTPS 和稳定的托管服务。
  • 提前统一尺寸。如果服务商自动调整尺寸,你的宽高比可能会偏移。

一个小技巧:如果必须使用 URL(比如图片存放在 CMS 中),我会添加一个简单的代理,下载文件、检查 MIME 类型和大小,并短暂地重新托管它。这消除了一整类”生成过程中 404”的错误。

实际使用场景

以下是让 Z-Image-Turbo 在我工作周中占据一席之地的场景。不花哨,但可靠。

照片增强与放大

我使用 0.2–0.35 的强度,配合简短的提示词,比如”干净的对比度、自然的肤色、减少色彩噪点”。第一次运行并不省时,因为我还是会微调,但到第三次运行时,我注意到它减少了心理负担。我不再在 Lightroom 里做微观决策,而是给出一个推动,然后继续前进。

对于放大,我将宽高设置为目标尺寸,保持适中的步数。输出比朴素的放大干净,但硬边缘上可能出现光晕。如果看到这种情况,我会以 0.15 强度再做一次,附注”更锐利的边缘,无光晕”。

风格迁移工作流

当团队想要统一视觉风格但素材来源各异时,我将强度固定在 0.65–0.75。我用一两句话描述材质和光线(例如”哑光纸张质感、来自左侧的柔和定向光、低饱和色调”)。这能快速统一一批杂乱的素材。它不是品牌规范执行的银弹,但能将事情推进 70%。之后我再做小幅手动修正。

我还维护着一个”风格库”——本质上是一个带有名称的提示词 YAML 文件。这样我就能在代码中切换风格,而无需重写描述。这防止我把提示词过度拟合到某一张图上。

产品图变体

对于电商横幅,我会保留产品边缘。两个习惯很有帮助:

  • 运行前遮罩或裁剪掉实时文字,运行后重新添加。
  • 强度保持在 0.5 以下,除非你想让模型自由发挥材质。

像”柔和的棚拍光、中性灰背景、产品下方轻微阴影”这样的提示词效果不错。如果反射效果变得混乱,我会固定一个种子并以略低的引导值重跑,以放松提示词的牵引力。