ComfyUI Nano Banana Pro 工作流:安裝、節點和最佳預設值
你凝視著 ComfyUI 節點圖,Nano Banana Pro 已安裝但似乎沒有正常運作——聽起來很熟悉吧?想像這樣的情景:全新安裝、所有關鍵節點都位置正確,最佳預設值已經在沒有調整的情況下解決了你的第一次推理運行。我是你的朋友 Dora。我多次走過這條路,在本文中我們將逐步介紹安裝、基本節點設置和將困惑轉變為流暢工作流程的預設值。

何時值得使用 ComfyUI
當我需要之後不會出問題的控制、提示路由、種子、解析度和重複結果的清晰方式時,我會選擇 ComfyUI。單個盒子中的文本到圖像生成速度很快,但小的更改變得模糊不清。在 ComfyUI 中,我可以看到發生了什麼,並一次調整一個東西。
以下是收益最大的幾個情況:
- 在視覺風格上反覆迭代,其中種子很重要,我需要在下週重現它。
- 在同一天混合 SDXL 和 SD1.5 模型,不想每次都重新學習 UI。
- 記錄圖像是如何製作的。ComfyUI 預設將圖表寫入 PNG 元數據中。這太棒了。
我不會為了快速情感板或一次性縮圖而打開 ComfyUI。當從提示到輸出的路徑應該清晰可見時,它最發閃光。ComfyUI Nano Banana Pro 工作流程生活在那個區域:小到可以在幾秒鐘內加載,清晰到未來的我不會詛咒過去的我。
如果你需要在 API 端也有相同的可預測性——固定路由、沒有意外模型交換、清晰的使用情況可見性——我們的 WaveSpeed 專注於保持模型訪問穩定和透明,所以基礎設施不會成為你必須照管的另一件事。
最小節點圖
我精簡了圖表,直到再移除一個節點會讓情況變差。SD1.5 和 SDXL 的核心是相同的:我只是交換檢查點和解析度。
以下是我著手的骨幹:
- 檢查點加載器(模型 + CLIP + VAE 一起)
- CLIP 文本編碼(正面)
- CLIP 文本編碼(負面)
- 空潛在圖像(大小、批次)
- KSampler(採樣器、步驟、CFG、種子)
- VAE 解碼
- 保存圖像
可選,但仍然輕巧:
- 潛在上採樣(如果我想要更大的圖像而無需從頭重新採樣)
- 圖像縮放(用於最終像素調整大小)
這裡的靜悄悄的勝利是每次渲染一個 KSampler。我嘗試過鏈接花哨的精煉器和調度器,但圖表變得雜亂,輸出變得不太可預測。使用這個最小設備,我可以切換模型並保持我的心理地圖完整。
現場筆記:我將提示節點保持靠近採樣器,並將圖像節點推向右側。當我看一眼圖表時,我可以看到「文字 → 潛在 → 解碼 → 保存」。聽起來很明顯,但布局影響我工作的冷靜程度。
推薦的預設值
預設值是我為未來的自己節省最多時間的地方。這些是我設置的值,除非有原因,否則很少改變。
模型/解析度:
-
SD1.5:768×768 用於正方形。它提供的細節比 512 多,但不會對 VRAM 造成壓力。
-
SDXL:當我真的需要 SDXL 時為 1024×1024;否則我堅持 832×1216 或 1216×832 用於肖像/場景。能被 64 整除會讓採樣器高興。
採樣器/步驟/CFG(KSampler): -
採樣器:DPM++ 2M Karras
-
步驟:18–24(SD1.5)、22–28(SDXL)
-
CFG:4.5–6.5 取決於提示強度
負面提示:
- 保持一個小的、穩定的集合。我使用「模糊、額外手指、重疊肢體、水印、低解析度、JPEG 偽影」。這很無聊是故意的。
批處理:
- 探索時批次大小 2–4、批次計數 1。如果 VRAM 緊張,請使用批次計數而不是批次大小以避免尖峰。
這些預設值產生「足夠好」和可預測的結果。當我需要更銳利或更風格化的東西時,我一次改變一件事,如果它沒有幫助就將其回滾。
一致性設置
一致性主要是關於不讓小的偏差複合。幾個槓桿比其餘的更重要。
種子紀律:
- 一旦看到你喜歡的方向,就鎖定種子。我會用固定的種子探索提示,然後複製節點並嘗試新種子來檢查魯棒性。
提示長度:
- 短提示穩定得更快。如果我發現自己寫了一段話,我將其分開:主題、風格提示、照明。三行勝過一個冗長的話。
CFG 理智:
- 太高會模化掉模型學習的結構;太低你會得到混亂。我的大多數穩定輸出著陸在 CFG 5–6。
解析度變化:
- 如果我將潛在上採樣 1.5–2×,我保持相同的種子和採樣器。大的跳躍(如 512→2048)改變感覺:除非風格能夠處理,否則我避免它們。
版本說明:
- 我在 2026 年 1 月使用當前 ComfyUI 構建和常見的 SD1.5/SDXL 檢查點對此進行了測試。調度器會發展,但種子/CFG 平衡在各個版本上仍然有用。
實際上,這些習慣減少了重新渲染。在一周內,我感到了一個小但真實的收益,也許每個圖像集節省了 3-5 分鐘,但更重要的是,減少了自我懷疑。
上採樣策略
我嘗試兩條路徑並為項目選擇更平靜的一條。
路徑 A:潛在上採樣
- 在 VAE 解碼之前使用潛在上採樣(1.5× 或 2×)。
- 重複使用相同的種子和採樣器設置。
- 優點:保持細節連貫;內存便宜。
- 缺點:將其推過 2×,偽影會蔓延。
路徑 B:解碼後的圖像調整大小
- 首先解碼,然後圖像縮放到目標(Lanczos 效果很好),可選擇輕微的銳化。
- 優點:快速、可預測的佈局需求大小調整。
- 缺點:你在拉伸像素,而不是發明新細節。
如果我正在交付海報大小的圖像,我有時會做一個混合:1.5× 潛在上採樣、解碼,然後小圖像調整大小以達到確切尺寸。它穩定,避免了「模糊上採樣」的外觀,而不用追求異國情調的節點。
常見節點錯誤
這些是我最常遇到的困境,以及我如何度過它們。
- 模型/CLIP 不匹配:如果輸出以不是風格化的方式看起來「不對」,請檢查檢查點、CLIP 和 VAE 是否對齊。單個檢查點加載器有助於避免交叉接線。
- 大小不能被 64 整除:潛在層喜歡乾淨倍數。如果節點抱怨或圖像裁剪得很奇怪,我將尺寸圓整到最近的 64。
- CUDA OOM:首先降低批次大小。如果這還不夠,在觸及步驟之前將解析度降低一步(例如 1024→896)。
- 種子實際上沒有固定:某些圖表會悄悄地重新初始化種子。我連接一個種子節點或直接將其輸入 KSampler,並觀察預覽是否有偏差。
- 負面提示未連接:當我忘記時,我得到「更響亮」的圖像。我在視覺上將負面編碼器節點保持靠近正面編碼器節點,以避免懸掛的接線。
這些都不戲劇化,但早期捕捉它們會保持會話的平靜。
導出提示
我不想稍後尋找設置。兩個習慣會有幫助。
- 文件命名:在保存圖像中,我設置一個模式,在文件名中包含種子和模型名稱。當客户端要求「版本 3、相同風格、更大」時,我可以追蹤它。
- 嵌入工作流程:ComfyUI 將圖表寫入 PNG 元數據。如果我需要共享或重新訪問,我將 PNG 加載回 ComfyUI,圖表重建。無需額外說明。
- JSON 備份:當我更改結構性的東西時,我仍然導出工作流程 JSON。每個模型家族一個小模板可保持清潔。
小細節:我將輸出保持在日期文件夾中。這並不花哨,但它是「在 10 秒內找到它」和「那去哪兒了?」之間的區別。
模板下載想法
我一直在考慮共享一個單一的 ComfyUI Nano Banana Pro 工作流程模板,圖表內有兩個選項卡:一個針對 SD1.5 的尺寸,一個針對 SDXL 的尺寸,相同的節點順序,相同的合理預設值。你將交換檢查點、設置提示並選擇潛在或圖像上採樣。
基本上就是我現在使用的圖表,安靜、標記、足夠輕以一目了然地理解。而如果你更喜歡帶有風格器和精煉器的更重的圖表,這是公平的。我喜歡看到當我轉動一個刻度盤時會發生什麼。
我會繼續精簡它。一次一個小變化仍然是我知道的最快的方式來達到我信任的東西。






