ComfyUI Nano Banana Pro 工作流:安装、节点和最佳默认设置

ComfyUI Nano Banana Pro 工作流:安装、节点和最佳默认设置

你正盯着ComfyUI节点图,Nano Banana Pro已安装但似乎没有正常工作——听起来很熟悉吗?想象一下:干净的安装,所有关键节点放置正确,最佳默认设置已经解决了你的第一次推理运行而无需调整。我是你的朋友Dora。我走过这条路很多次,在这篇文章中我们将演练安装、必要的节点设置和将混淆转化为顺畅工作流的默认设置。

什么时候ComfyUI值得使用

当我需要能够控制的方式而不会之后惹麻烦、提示词路由、种子、分辨率和重复结果的清晰方式时,我会使用ComfyUI。在单个框中进行文本转图像很快,但小的更改会变得混乱。在ComfyUI中,我可以看到发生了什么,并逐次调整一件事。

有几个地方值得使用:

  • 迭代视觉风格,其中种子很重要,我需要在下周再现它。
  • 在同一天混合SDXL和SD1.5模型,而不想重新学习每次的用户界面。
  • 保留图像制作方式的记录。ComfyUI默认将图写入PNG元数据。这很宝贵。

我不会为快速情绪板或一次性缩略图打开ComfyUI。当从提示词到输出的路径应该是清晰的时,它就会闪耀。ComfyUI Nano Banana Pro工作流位于该区域:小到足以在几秒内加载,清楚到未来的我不会对过去的我诅咒。

如果你曾经需要API端的同一种可预测性——固定路由、无意外模型交换、清晰的使用可见性——我们的WaveSpeed专注于保持模型访问稳定和透明,所以基础设施不会成为你必须照看的另一件事。

➡️在这里尝试Wavespeed!

最小节点图

我削减了图,直到删除再多一个节点就会更糟。SD1.5和SDXL的核心相同:我只是交换检查点和分辨率。

这是我使用的骨架:

  • 检查点加载器(模型+CLIP+VAE在一起)
  • CLIP文本编码(正向)
  • CLIP文本编码(反向)
  • 空潜在图像(大小、批次)
  • KSampler(采样器、步数、CFG、种子)
  • VAE解码
  • 保存图像

可选的,但仍然简洁:

  • 潜在升级(如果我想要更大的图像而不需要从头重新采样)
  • 图像缩放(用于最终像素调整)

这里的微妙胜利是每次渲染一个KSampler。我尝试过链接花哨的精化器和调度器,但图变得混乱,输出变得不那么可预测。使用这个最小设置,我可以切换模型并保持我的心理地图完整。

字段注记:我将提示节点保持靠近采样器,并将图像节点推向右边。当我扫一眼图形时,我可以看到”词→潜在→解码→保存。“这听起来很明显,但布局影响我如何平静地工作。

推荐的默认设置

默认设置是我为未来的自己节省最多时间的地方。这些是我设置的值,除非有原因,否则很少触及。

模型/分辨率:

  • SD1.5:正方形768×768。它提供比512更多的细节,而不会给VRAM造成压力。

  • SDXL:当我真正需要SDXL时为1024×1024;否则我坚持832×1216或1216×832用于肖像/场景。可被64整除可以让采样器满意。 采样器/步数/CFG(KSampler):

  • 采样器:DPM++ 2M Karras

  • 步数:18–24(SD1.5)、22–28(SDXL)

  • CFG:4.5–6.5,取决于提示强度

反向提示:

  • 保持一个小的、稳定的集合。我使用”模糊、额外的手指、重叠的肢体、水印、低分辨率、jpeg伪影。“这故意很无聊。

批处理:

  • 在探索时批大小2–4,批计数1。如果VRAM紧张,使用批计数而不是批大小来避免峰值。

这些默认设置产生”足够好”和可预测的结果。当我需要更清晰或更风格化的东西时,我逐次改变一件事,如果没有帮助就回滚。

一致性设置

一致性主要是关于不让小的漂移复合。一些杠杆比其他的更重要。

种子纪律:

  • 一旦你看到你喜欢的方向就锁定种子。我会使用固定种子探索提示词,然后复制节点并尝试新种子来检查稳健性。

提示长度:

  • 短提示稳定得更快。如果我发现自己在写一段话,我就分割它:主题、风格提示、照明。三行胜过一个啰嗦的。

CFG理智:

  • 太高了,你会强制使出模型学到的结构:太低了,你会得到糊状物。我大部分稳定的输出都落在CFG 5–6。

分辨率变化:

  • 如果我将潜在升级1.5–2×,我保持相同的种子和采样器。大跳跃(如512→2048)改变感觉:除非风格能处理,否则我避免它们。

版本注记:

  • 我在2026年1月用当前的ComfyUI构建和常见的SD1.5/SDXL检查点进行了测试。调度器在演变,但种子/CFG平衡在各个版本中保持有用。 在实践中,这些习惯减少了重新渲染。在一周内,我感受到了小但真实的收益,每组图像可能节省3–5分钟,但更重要的是,更少的自我怀疑。

升级策略

我尝试两条路径,为项目选择更平静的路径。

路径A:潜在升级

  • 在VAE解码前使用潜在升级(1.5×或2×)。
  • 重用相同的种子和采样器设置。
  • 优点:保持细节连贯:记忆便宜。
  • 缺点:超过2×,伪影就会爬进来。

路径B:解码后调整图像大小

  • 首先解码,然后调整为目标大小(Lanczos效果很好),可选的轻度锐化。
  • 优点:快速、可预测的布局需求尺寸。
  • 缺点:你在拉伸像素,而不是发明新细节。

如果我要提供海报尺寸的图像,我有时会做一个混合:1.5×潜在升级、解码,然后一个小的图像调整以击中确切尺寸。它很稳定,避免了”涂抹升级”的外观,而不用追逐奇特的节点。

常见节点错误

这些是我最常遇到的障碍,以及我如何克服它们。

  • 模型/CLIP不匹配:如果输出看起来”不对”的方式不是风格问题,检查检查点、CLIP和VAE是否对齐。单个检查点加载器有助于避免交叉接线。
  • 大小不能被64整除:潜在喜欢干净的倍数。如果节点抱怨或图像裁剪很奇怪,我将尺寸舍入到最近的64。
  • CUDA OOM:首先降低批大小。如果还不够,在触及步数之前将分辨率降低一步(例如1024→896)。
  • 种子实际上没有固定:一些图形悄悄地重新初始化种子。我连接一个种子节点或直接将其输入KSampler并查看预览以查看漂移。
  • 反向提示未连接:当我忘记时,我得到”更响亮”的图像。我将反向编码器节点视觉上保持靠近正向编码器节点,以避免悬空的连线。

没有什么是戏剧性的,但及早发现它们可以使会话平静。

导出提示

我不想之后去寻找设置。两个习惯可以帮助。

  • 文件命名:在保存图像中,我使用种子和模型名称在文件名中的模式。当客户要求”版本3,相同风格、更大”时,我可以追踪它。
  • 嵌入式工作流:ComfyUI将图写入PNG元数据。如果我需要共享或重新访问,我将PNG加载回ComfyUI,图会重建。不需要额外的注记。
  • JSON备份:当我更改结构性的东西时,我仍然导出工作流JSON。每个模型系列一个小模板可以保持干净。

小细节:我将输出保存在有日期的文件夹中。这不花哨,但这是”在10秒内找到”和”那去哪儿了?“之间的区别。

模板下载想法

我一直在考虑分享一个ComfyUI Nano Banana Pro工作流模板,在图中有两个选项卡:一个为SD1.5调整大小,一个为SDXL调整大小,相同的节点顺序,相同的理智默认设置。你会交换检查点,设置你的提示词,并选择潜在或图像升级。

这基本上是我现在使用的图,安静、标记、足够轻以一目了然地理解。而且如果你更喜欢带有风格化器和精化器的更重图,这是公平的。我喜欢看到当我移动一个拨号盘时会发生什么。

我会继续削减它。逐次改变一件小事仍然是我知道的最快的方式来获得我信任的东西。