ComfyUI Nano Banana Pro Workflow: Установка, узлы и оптимальные настройки по умолчанию
Вы смотрите на граф узлов ComfyUI, Nano Banana Pro установлен, но ничего не работает правильно — знакомо? Представьте себе: чистую установку, все ключевые узлы расставлены правильно, и лучшие настройки по умолчанию уже решают вашу первую работу без каких-либо изменений. Я ваш помощник, Дора. Я прошел этот путь много раз, и в этой статье мы пройдемся по установке, основным настройкам узлов и значениям по умолчанию, которые превращают путаницу в плавные рабочие процессы.

Когда ComfyUI того стоит
Я обращаюсь к ComfyUI, когда мне нужен контроль, который не создает проблемы позже: маршрутизация промптов, seeds, разрешения и чистый способ повторить результат. Текст-в-изображение в одном окне быстро, но небольшие изменения становятся неясными. В ComfyUI я могу видеть, что происходит, и подстраивать одно за раз.
Вот несколько случаев, где это окупается:
- Доработка визуального стиля, где seed имеет значение, и мне нужно будет воспроизвести его на следующей неделе.
- Смешивание моделей SDXL и SD1.5 в течение одного дня без необходимости переучивать интерфейс каждый раз.
- Ведение записи о том, как было создано изображение. ComfyUI по умолчанию записывает граф в метаданные PNG. Это золото.
Я не открываю ComfyUI для быстрого создания настроений или одноразовых миниатюр. Это сияет, когда путь от промпта к выводу должен быть ясным. Рабочий процесс ComfyUI Nano Banana Pro находится в этой зоне: достаточно мал, чтобы загружаться за секунды, достаточно ясен, чтобы я не ругал сам себя потом.
Если вам когда-либо нужна такая же предсказуемость на стороне API — фиксированная маршрутизация, без неожиданной замены моделей, понятная видимость использования — наш WaveSpeed сосредоточен на поддержании стабильного и прозрачного доступа к моделям, поэтому инфраструктура не становится еще одной вещью, которую нужно контролировать.
Минимальный граф узлов
Я сокращал граф до тех пор, пока удаление еще одного узла не делало его хуже. Основа одинакова для SD1.5 и SDXL: я просто меняю контрольную точку и разрешение.
Вот основу, на которой я остановился:
- Checkpoint Loader (модель + CLIP + VAE вместе)
- CLIP Text Encode (положительный)
- CLIP Text Encode (отрицательный)
- Empty Latent Image (размер, пакет)
- KSampler (сэмплер, шаги, CFG, seed)
- VAE Decode
- Save Image
Опционально, но все еще легко:
- Latent Upscale (если я хочу большие изображения без пересэмплирования с нуля)
- Image Scale (для финального изменения размера пикселей)
Тихая победа здесь — один KSampler на рендеринг. Я пробовал объединять причудливые рефайнеры и планировщики, но граф становился запутанным, а выводы — менее предсказуемыми. С этой минимальной установкой я могу менять модели и сохранять свою ментальную карту в целости.
Полевая заметка: я держу узлы промптов близко к сэмплеру и отодвигаю узлы изображений вправо. Когда я смотрю на граф, я вижу «слова → латентное пространство → декодирование → сохранение». Звучит очевидно, но макет влияет на то, насколько спокойно я работаю.
Рекомендуемые значения по умолчанию
Значения по умолчанию — это то, где я экономлю время для своего будущего «я». Это значения, которые я устанавливаю и редко трогаю, если нет причины.
Модель/разрешение:
-
SD1.5: 768×768 для квадрата. Это дает больше деталей, чем 512, без перегрузки VRAM.
-
SDXL: 1024×1024, когда мне действительно нужен SDXL: в противном случае я придерживаюсь 832×1216 или 1216×832 для портретов/сцен. Делимость на 64 держит сэмплер в хорошем состоянии.
Сэмплер/шаги/CFG (KSampler): -
Сэмплер: DPM++ 2M Karras
-
Шаги: 18–24 (SD1.5), 22–28 (SDXL)
-
CFG: 4.5–6.5 в зависимости от силы промпта
Отрицательный промпт:
- Держите небольшой, стабильный набор. Я использую «blurry, extra fingers, overlapping limbs, watermark, low-res, jpeg artifacts.» Это скучно с умыслом.
Пакетная обработка:
- Размер пакета 2–4 при исследовании, количество пакетов 1. Если VRAM ограничен, используйте количество пакетов вместо размера пакета, чтобы избежать скачков.
Эти значения по умолчанию дают результаты, которые «достаточно хороши» и предсказуемы. Когда мне нужно что-то более четкое или стилизованное, я меняю одно за раз и откатываюсь, если это не помогает.
Настройки согласованности
Согласованность — это в основном предотвращение накопления небольших отклонений. Несколько рычагов имеют большее значение, чем остальные.
Дисциплина seed:
- Заблокируйте seed, как только увидите направление, которое вам нравится. Я буду исследовать промпты с фиксированным seed, затем дублирую узел и пробую новый seed, чтобы проверить надежность.
Длина промпта:
- Короткие промпты стабилизируются быстрее. Если я ловлю себя на написании абзаца, я его разбиваю: предмет, подсказка стиля, освещение. Три строки лучше одного потока сознания.
Санитария CFG:
- Слишком высокий и вы подавляете выученную структуру модели: слишком низкий и вы получаете кашу. Большинство моих стабильных выводов находятся на CFG 5–6.
Изменения разрешения:
- Если я увеличиваю масштаб латентного пространства в 1.5–2 раза, я сохраняю тот же seed и сэмплер. Большие скачки (например, 512→2048) меняют ощущение: я их избегаю, если только стиль это не выдержит.
Примечания версии:
- Я протестировал это в январе 2026 года с текущими ComfyUI сборками и обычными контрольными точками SD1.5/SDXL. Планировщики развиваются, но баланс seed/CFG остается полезным во всех версиях.
На практике эти привычки сокращают повторные рендеринги. За неделю я почувствовал небольшой, но реальный прирост, может быть, 3–5 минут сэкономлено на набор изображений, но что более важно, меньше сомнений в себе.
Стратегия увеличения масштаба
Я пробую два пути и выбираю более спокойный для проекта.
Путь A: увеличение масштаба латентного пространства
- Используйте Latent Upscale (1.5× или 2×) перед VAE Decode.
- Переиспользуйте те же настройки seed и сэмплера.
- Плюсы: сохраняет детали логичными: дешево по памяти.
- Минусы: если продвинуть дальше 2×, появятся артефакты.
Путь B: изменение размера изображения после декодирования
- Сначала декодируйте, затем Image Scale до целевого (Lanczos работает хорошо), опционально легкую четкость.
- Плюсы: быстро, предсказуемо для потребностей макета.
- Минусы: вы растягиваете пиксели, а не придумываете новые детали.
Если я доставляю изображение размером с плакат, я иногда делаю гибрид: увеличение масштаба 1.5× латентного пространства, декодирование, затем небольшое изменение размера изображения, чтобы попасть в точные размеры. Это стабильно и избегает вида «размытого масштабирования» без погони за экзотическими узлами.
Распространенные ошибки узлов
Это препятствия, на которые я наталкиваюсь чаще всего, и как я их преодолеваю.
- Несовпадение Model/CLIP: Если выводы выглядят «неправильно» способом, который не является стилистическим, проверьте, выровнены ли контрольная точка, CLIP и VAE. Один Checkpoint Loader помогает избежать перекрестной коммутации.
- Размер не делится на 64: Латентному пространству нравятся чистые кратные. Если узел жалуется или изображения странно обрезаются, я округляю размеры до ближайшего 64.
- CUDA OOM: Сначала уменьшите размер пакета. Если этого недостаточно, уменьшьте разрешение на один шаг (например, 1024→896) перед тем, как трогать шаги.
- Seeds на самом деле не фиксированы: Некоторые графы тихо переинициализируют seeds. Я подключаю узел Seed или вводу его прямо в KSampler и смотрю на предпросмотр на предмет смещения.
- Отрицательный промпт не подключен: Когда я забываю, я получаю более «громкие» изображения. Я держу узел отрицательного кодировщика визуально близко к положительному, чтобы избежать висячих проводов.
Ничего из этого не является драматичным, но раннее обнаружение ошибок сохраняет сеанс спокойным.
Советы по экспорту
Я не хочу искать настройки позже. Два привычка помогают.
- Именование файлов: В Save Image я устанавливаю шаблон с seed и названием модели в имени файла. Когда клиент просит «версия 3, тот же стиль, больше», я могу отследить это.
- Встроенный рабочий процесс: ComfyUI записывает граф в метаданные PNG. Если мне нужно поделиться или пересмотреть, я загружаю PNG обратно в ComfyUI и граф восстанавливается. Никаких дополнительных заметок не нужно.
- Резервные копии JSON: Я все еще экспортирую JSON рабочего процесса, когда меняю что-то структурное. Один маленький шаблон на семейство моделей сохраняет чистоту.
Маленькая деталь: я храню выводы в папках с датами. Это не причудливо, но это разница между «найти за 10 секунд» и «куда это делось?»
Идея загрузки шаблона
Я думаю о том, чтобы поделиться одним шаблоном рабочего процесса ComfyUI Nano Banana Pro с двумя вкладками внутри графика: одна для SD1.5, одна для SDXL, тот же порядок узлов, те же разумные значения по умолчанию. Вы меняли бы контрольную точку, устанавливали свой промпт и выбирали увеличение масштаба латентного пространства или изображения.
Это в основном граф, который я использую сейчас, тихий, обозначенный и достаточно легкий, чтобы понять с первого взгляда. И если вы предпочитаете более тяжелые графы со стилизаторами и рефайнерами, это справедливо. Мне нравится видеть, что меняется, когда я двигаю один циферблат.
Я буду продолжать его совершенствовать. Один небольшой шаг за раз — это все еще самый быстрый способ, который я знаю, чтобы добраться до чего-то, чему я могу доверять.






