Z-Image-Turbo 局部重绘 API:蒙版工作流与瑕疵修复
完整的 Z-Image-Turbo 局部重绘指南。学习蒙版创建、自然语言提示词、无缝融合技术以及常见瑕疵的修复方法。每张图片仅需 $0.02。
嘿,我是 Dora。上周有件小事让我卡了一下——一张产品照片上有个眩光点,我需要重复使用这张图。我不想做全面的修图,只想做个小调整。我打开了常用工具,然后停顿了一下。我一直看到有人提到 Z-Image-Turbo Inpainting API,很想知道它能不能融入我的日常流程,而不是把一个五分钟的修复变成一个大项目。于是我尝试了它,慢慢地,跨越了几个真实任务,并一路记下了笔记。
什么是 AI 修复(Inpainting)?
Inpainting 是图像编辑中的”清洁工”。你用蒙版遮住某个区域,描述你想要替换成什么(或者什么都不要),然后模型会填充这个区域,使其与图像其余部分融合。
我喜欢 Inpainting 的原因在于它感觉很精准。你不是在要求模型凭空创造一个完整场景,而只是让它尊重你已有的画面。效果好的时候,编辑痕迹会消失。效果不好的时候,你会看到接缝、奇怪的纹理,或者填充区域那种小小的”AI 雾感”——那说明你推得太过了。
Z-Image-Turbo Inpaint 的工作原理
我在 2026 年 1 月至 2 月测试了 Z-Image-Turbo 的 Inpainting 功能,用于几项任务:去除眩光、背景清理,以及几次对象替换。流程很标准:向 Z-Image-Turbo Inpainting API 发送图像、二值蒙版和提示词。模型只编辑被遮罩的区域,并尝试与周围上下文融合。
实际操作中有两个细节很重要:
- 蒙版边缘:柔和边缘融合效果更好,硬边缘会产生接缝。
- 提示词:简短、字面意思的提示词效果最好,过度描述会让模型乱猜。
速度方面,结果几秒钟就返回了,对于我工作流中的异步任务来说已经足够快。根据 WaveSpeed 的文档,Z-Image-Turbo Inpaint 针对低延迟和干净结果进行了优化,可用于批量处理和快速迭代的生产环境。小到中等范围的编辑质量很稳定。较大、较复杂的替换需要多试几次,或者使用更小的蒙版。
API 工作流程
我保持工作流程简单:保持源图像原样,只蒙住我想更改的部分,并用平实的语言写提示词。
必需输入:图像 + 蒙版 + 提示词
以下是我反复使用的最小输入集:
- 图像:PNG 或 JPEG。我保持原始分辨率,以避免上/下采样伪影。
- 蒙版:与图像相同的宽度和高度。白色 = 可编辑,黑色 = 受保护。如果你使用的 API 版本反转了这一逻辑,通常有一个标志可以反转。
- 提示词:一句话就够了。“去除台面上的眩光。“或”将马克杯替换为普通白色陶瓷杯。”
有帮助的可选参数:
- 引导强度(Guidance/strength):轻微清理时调低,完全替换时调高。
- 种子(Seed):设置种子以重现好的结果。
- 步数(Steps):我保持适中,更多步数并不总是意味着更好。
蒙版格式要求
这部分对质量影响最大:
- 使用二值蒙版(纯白和纯黑)。如果需要柔和感,稍微羽化边缘,但要避免整个区域都是灰色的模糊蒙版。
- 尺寸要完全匹配。如果蒙版偏差一个像素,API 会报错或对齐错位。
- 保持蒙版区域紧凑,蒙版越小,模型产生幻觉的机会就越少。
- 注意细小细节。对于发丝或电缆,稍大一点的柔和蒙版比极细的硬蒙版融合效果更好。
如果在边缘附近编辑,将蒙版稍微延伸到边界之外。这给模型提供了在接缝下方绘制的空间,避免出现”贴纸”感。
Python 实现
我没有把它做成一个完整的库,而是在一个小型工具脚本中使用了简短的请求。要点如下:
- 向 Z-Image-Turbo Inpainting 端点 发送 multipart 表单数据的 POST 请求。
- 附带:图像文件、蒙版文件、提示词字符串,以及任何可选参数(引导强度、步数、种子、输出尺寸等)。
- 处理响应:base64 编码的图像或可获取的 URL。保存后,在提交到流水线之前先预览。
设置过程中的几点实用说明:
- 注意速率限制。我批量处理编辑并添加了退避逻辑,以避免重试。
- 将每张保存图像的确切提示词、种子和参数记录下来。当我得到一个干净的结果时,这让重现它变得轻而易举。
- 如果你在构建 UI,在发送请求前先在源图像上预览蒙版叠加。我通过这种方式在发送请求前发现了两次蒙版对齐错误。
编写有效的 Inpainting 提示词
我大部分的成功来自更简短、更字面的提示词。蒙版完成了大部分的工作:提示词应该起引导作用,而不是进行叙述。
去除提示词(“干净的表面”)
当我只需要去除某样东西时,我写的提示词描述了缺失后的状态和我想要的质感:“去除反光:保持哑光、均匀的表面”,或”去除灰尘颗粒:保留木纹。“当我提到周围纹理时,模型对其的尊重程度更高。
一个小技巧:在光线重要时提及它。“保持柔和的午后光线”防止了亮斑的出现。
替换提示词(描述新内容)
对于替换,我做到了具体但简洁:
- “将红色马克杯替换为普通白色陶瓷杯,大小相似,中性光线。”
- “用匹配的混凝土纹理填充间隙:无图案。”
我避免使用邀请风格的形容词(例如”漂亮”、“电影感”),它们会鼓励模型自由发挥。尺寸描述也很有帮助。“大小相似”或”相同角度”减少了尴尬的透视偏移。
感知上下文的提示词
当场景具有强烈风格——暖光、柔和阴影、浅景深——我会在提示词中告知这些。根据 RunComfy 上的社区测试,当提示词明确引用现有场景上下文时,Z-Image-Turbo Inpainting 展现出强大的纹理连续性、真实的光照效果和准确的透视处理。Z-Image-Turbo Inpainting API 似乎会依赖这些线索。“匹配现有暖光,左侧柔和阴影”比抽象的”写实”效果更好。
如果周围上下文较弱(繁杂图案、细节少),我会缩小蒙版并分两步处理:第一步做结构(形状),第二步做表面(纹理/光线)。多花了一分钟,但最终结果 AI 感更少。
实际应用
这些是 Z-Image-Turbo Inpainting API 在我一周工作中发挥作用的场景。
产品照片清理
我用它处理了一小批桌面拍摄照片:零散的划痕、背景布上的折痕,以及来自灯具的奇怪热点。去除提示词就足够了。时间上,与手动修复相比,每张图片节省了大约 3-4 分钟。真正的收获在于脑力消耗——需要做的微决策更少了。
去除不需要的对象
我用街头照片进行了测试:店面旁边的垃圾桶,以及画面边缘的行人一角。配合紧凑的蒙版和关于”延续砖块图案”或”延伸人行道纹理”的说明,填充效果融合良好。跨越复杂纹理的大面积去除仍然需要多试几次。
背景替换
完整的背景替换更棘手。对于简单场景(纸张上的桌面物品),我可以将背景替换为纯渐变色,并通过将蒙版放在物体下方而非周围来保留自然阴影。复杂背景前的头发就更难处理了。只有在蒙版干净且新背景简单的情况下,我才会在这里使用 Inpainting。
修复常见伪影
当某些地方看起来”不对劲”时,通常是以下几种情况之一。
蒙版边缘可见接缝
症状:修复区域与原始图像交界处有淡淡的轮廓。
有效方法:
- 稍微羽化蒙版边缘并重新运行。
- 将蒙版区域扩大几个像素,让模型在接缝下方进行绘制。
- 如果填充结果相对简单的场景来说过度风格化,略微降低引导强度。
颜色/光线不匹配
症状:修复区域形状正确,但光线不对。
有效方法:
- 在提示词中提及光线方向和色温:“匹配来自右侧的暖光,柔和阴影。”
- 略微减少步数。我发现采样步数过多有时会导致颜色偏移。
- 如果整张照片经过了调色,先做 Inpainting,再对最终结果重新应用调色。
纹理不一致
症状:表面看起来模糊或过于均匀。
有效方法:
- 明确描述纹理(“细腻的帆布纹理”、“微妙的木纹”)。
- 缩小蒙版并分阶段填充:先做结构,再做纹理。
- 事后添加少量噪点或颗粒感进行融合。不够纯粹,但很有效。
,为什么这对我很重要:Inpainting 并不炫酷,但它减少了小型、不起眼的编辑中的摩擦。Z-Image-Turbo Inpainting API 没有改变我的流程:它悄悄融入了其中。如果你经常做轻量级清理或偶尔的对象替换,并且习惯绘制蒙版,它是个很好的选择。如果你想做大幅度的场景重写,你仍然需要花时间调整蒙版和提示词。
测试中最后一点心得:当我把提示词当作舞台指导,把蒙版当作边界来对待时,效果最好。分工明确。模型在这种情况下表现良好。我仍然很好奇,在棘手纹理上用极小的蒙版能推进到什么程度,而不产生那种标志性的”雾感”——这是我下一步想探索的。你呢?





