ComfyUI Nano Banana Pro 工作流：安装、节点和最佳默认设置

2026-01-27

ComfyUI Nano Banana Pro 工作流：安装、节点和最佳默认设置

你正盯着ComfyUI节点图，Nano Banana Pro已安装但似乎没有正常工作——听起来很熟悉吗？想象一下：干净的安装，所有关键节点放置正确，最佳默认设置已经解决了你的第一次推理运行而无需调整。我是你的朋友Dora。我走过这条路很多次，在这篇文章中我们将演练安装、必要的节点设置和将混淆转化为顺畅工作流的默认设置。

什么时候ComfyUI值得使用

当我需要能够控制的方式而不会之后惹麻烦、提示词路由、种子、分辨率和重复结果的清晰方式时，我会使用ComfyUI。在单个框中进行文本转图像很快，但小的更改会变得混乱。在ComfyUI中，我可以看到发生了什么，并逐次调整一件事。

有几个地方值得使用：

迭代视觉风格，其中种子很重要，我需要在下周再现它。
在同一天混合SDXL和SD1.5模型，而不想重新学习每次的用户界面。
保留图像制作方式的记录。ComfyUI默认将图写入PNG元数据。这很宝贵。

我不会为快速情绪板或一次性缩略图打开ComfyUI。当从提示词到输出的路径应该是清晰的时，它就会闪耀。ComfyUI Nano Banana Pro工作流位于该区域：小到足以在几秒内加载，清楚到未来的我不会对过去的我诅咒。

如果你曾经需要API端的同一种可预测性——固定路由、无意外模型交换、清晰的使用可见性——我们的WaveSpeed专注于保持模型访问稳定和透明，所以基础设施不会成为你必须照看的另一件事。

➡️在这里尝试Wavespeed！

最小节点图

我削减了图，直到删除再多一个节点就会更糟。SD1.5和SDXL的核心相同：我只是交换检查点和分辨率。

这是我使用的骨架：

检查点加载器（模型+CLIP+VAE在一起）
CLIP文本编码（正向）
CLIP文本编码（反向）
空潜在图像（大小、批次）
KSampler（采样器、步数、CFG、种子）
VAE解码
保存图像

可选的，但仍然简洁：

潜在升级（如果我想要更大的图像而不需要从头重新采样）
图像缩放（用于最终像素调整）

这里的微妙胜利是每次渲染一个KSampler。我尝试过链接花哨的精化器和调度器，但图变得混乱，输出变得不那么可预测。使用这个最小设置，我可以切换模型并保持我的心理地图完整。

字段注记：我将提示节点保持靠近采样器，并将图像节点推向右边。当我扫一眼图形时，我可以看到”词→潜在→解码→保存。“这听起来很明显，但布局影响我如何平静地工作。

推荐的默认设置

默认设置是我为未来的自己节省最多时间的地方。这些是我设置的值，除非有原因，否则很少触及。

模型/分辨率：

SD1.5：正方形768×768。它提供比512更多的细节，而不会给VRAM造成压力。
SDXL：当我真正需要SDXL时为1024×1024；否则我坚持832×1216或1216×832用于肖像/场景。可被64整除可以让采样器满意。采样器/步数/CFG（KSampler）：
采样器：DPM++ 2M Karras
步数：18–24（SD1.5）、22–28（SDXL）
CFG：4.5–6.5，取决于提示强度

反向提示：

保持一个小的、稳定的集合。我使用”模糊、额外的手指、重叠的肢体、水印、低分辨率、jpeg伪影。“这故意很无聊。

批处理：

在探索时批大小2–4，批计数1。如果VRAM紧张，使用批计数而不是批大小来避免峰值。

这些默认设置产生”足够好”和可预测的结果。当我需要更清晰或更风格化的东西时，我逐次改变一件事，如果没有帮助就回滚。

一致性设置

一致性主要是关于不让小的漂移复合。一些杠杆比其他的更重要。

种子纪律：

一旦你看到你喜欢的方向就锁定种子。我会使用固定种子探索提示词，然后复制节点并尝试新种子来检查稳健性。

提示长度：

短提示稳定得更快。如果我发现自己在写一段话，我就分割它：主题、风格提示、照明。三行胜过一个啰嗦的。

CFG理智：

太高了，你会强制使出模型学到的结构：太低了，你会得到糊状物。我大部分稳定的输出都落在CFG 5–6。

分辨率变化：

如果我将潜在升级1.5–2×，我保持相同的种子和采样器。大跳跃（如512→2048）改变感觉：除非风格能处理，否则我避免它们。

版本注记：

我在2026年1月用当前的ComfyUI构建和常见的SD1.5/SDXL检查点进行了测试。调度器在演变，但种子/CFG平衡在各个版本中保持有用。在实践中，这些习惯减少了重新渲染。在一周内，我感受到了小但真实的收益，每组图像可能节省3–5分钟，但更重要的是，更少的自我怀疑。

升级策略

我尝试两条路径，为项目选择更平静的路径。

路径A：潜在升级

在VAE解码前使用潜在升级（1.5×或2×）。
重用相同的种子和采样器设置。
优点：保持细节连贯：记忆便宜。
缺点：超过2×，伪影就会爬进来。

路径B：解码后调整图像大小

首先解码，然后调整为目标大小（Lanczos效果很好），可选的轻度锐化。
优点：快速、可预测的布局需求尺寸。
缺点：你在拉伸像素，而不是发明新细节。

如果我要提供海报尺寸的图像，我有时会做一个混合：1.5×潜在升级、解码，然后一个小的图像调整以击中确切尺寸。它很稳定，避免了”涂抹升级”的外观，而不用追逐奇特的节点。

常见节点错误

这些是我最常遇到的障碍，以及我如何克服它们。

模型/CLIP不匹配：如果输出看起来”不对”的方式不是风格问题，检查检查点、CLIP和VAE是否对齐。单个检查点加载器有助于避免交叉接线。
大小不能被64整除：潜在喜欢干净的倍数。如果节点抱怨或图像裁剪很奇怪，我将尺寸舍入到最近的64。
CUDA OOM：首先降低批大小。如果还不够，在触及步数之前将分辨率降低一步（例如1024→896）。
种子实际上没有固定：一些图形悄悄地重新初始化种子。我连接一个种子节点或直接将其输入KSampler并查看预览以查看漂移。
反向提示未连接：当我忘记时，我得到”更响亮”的图像。我将反向编码器节点视觉上保持靠近正向编码器节点，以避免悬空的连线。

没有什么是戏剧性的，但及早发现它们可以使会话平静。

导出提示

我不想之后去寻找设置。两个习惯可以帮助。

文件命名：在保存图像中，我使用种子和模型名称在文件名中的模式。当客户要求”版本3，相同风格、更大”时，我可以追踪它。
嵌入式工作流：ComfyUI将图写入PNG元数据。如果我需要共享或重新访问，我将PNG加载回ComfyUI，图会重建。不需要额外的注记。
JSON备份：当我更改结构性的东西时，我仍然导出工作流JSON。每个模型系列一个小模板可以保持干净。

小细节：我将输出保存在有日期的文件夹中。这不花哨，但这是”在10秒内找到”和”那去哪儿了？“之间的区别。

模板下载想法

我一直在考虑分享一个ComfyUI Nano Banana Pro工作流模板，在图中有两个选项卡：一个为SD1.5调整大小，一个为SDXL调整大小，相同的节点顺序，相同的理智默认设置。你会交换检查点，设置你的提示词，并选择潜在或图像升级。

这基本上是我现在使用的图，安静、标记、足够轻以一目了然地理解。而且如果你更喜欢带有风格化器和精化器的更重图，这是公平的。我喜欢看到当我移动一个拨号盘时会发生什么。

我会继续削减它。逐次改变一件小事仍然是我知道的最快的方式来获得我信任的东西。