ComfyUI Nano Banana Pro Workflow: Установка, узлы и оптимальные настройки по умолчанию

ComfyUI Nano Banana Pro Workflow: Установка, узлы и оптимальные настройки по умолчанию

Вы смотрите на граф узлов ComfyUI, Nano Banana Pro установлен, но ничего не работает правильно — знакомо? Представьте себе: чистую установку, все ключевые узлы расставлены правильно, и лучшие настройки по умолчанию уже решают вашу первую работу без каких-либо изменений. Я ваш помощник, Дора. Я прошел этот путь много раз, и в этой статье мы пройдемся по установке, основным настройкам узлов и значениям по умолчанию, которые превращают путаницу в плавные рабочие процессы.

Когда ComfyUI того стоит

Я обращаюсь к ComfyUI, когда мне нужен контроль, который не создает проблемы позже: маршрутизация промптов, seeds, разрешения и чистый способ повторить результат. Текст-в-изображение в одном окне быстро, но небольшие изменения становятся неясными. В ComfyUI я могу видеть, что происходит, и подстраивать одно за раз.

Вот несколько случаев, где это окупается:

  • Доработка визуального стиля, где seed имеет значение, и мне нужно будет воспроизвести его на следующей неделе.
  • Смешивание моделей SDXL и SD1.5 в течение одного дня без необходимости переучивать интерфейс каждый раз.
  • Ведение записи о том, как было создано изображение. ComfyUI по умолчанию записывает граф в метаданные PNG. Это золото.

Я не открываю ComfyUI для быстрого создания настроений или одноразовых миниатюр. Это сияет, когда путь от промпта к выводу должен быть ясным. Рабочий процесс ComfyUI Nano Banana Pro находится в этой зоне: достаточно мал, чтобы загружаться за секунды, достаточно ясен, чтобы я не ругал сам себя потом.

Если вам когда-либо нужна такая же предсказуемость на стороне API — фиксированная маршрутизация, без неожиданной замены моделей, понятная видимость использования — наш WaveSpeed сосредоточен на поддержании стабильного и прозрачного доступа к моделям, поэтому инфраструктура не становится еще одной вещью, которую нужно контролировать.

➡️Попробуйте Wavespeed здесь!

Минимальный граф узлов

Я сокращал граф до тех пор, пока удаление еще одного узла не делало его хуже. Основа одинакова для SD1.5 и SDXL: я просто меняю контрольную точку и разрешение.

Вот основу, на которой я остановился:

  • Checkpoint Loader (модель + CLIP + VAE вместе)
  • CLIP Text Encode (положительный)
  • CLIP Text Encode (отрицательный)
  • Empty Latent Image (размер, пакет)
  • KSampler (сэмплер, шаги, CFG, seed)
  • VAE Decode
  • Save Image

Опционально, но все еще легко:

  • Latent Upscale (если я хочу большие изображения без пересэмплирования с нуля)
  • Image Scale (для финального изменения размера пикселей)

Тихая победа здесь — один KSampler на рендеринг. Я пробовал объединять причудливые рефайнеры и планировщики, но граф становился запутанным, а выводы — менее предсказуемыми. С этой минимальной установкой я могу менять модели и сохранять свою ментальную карту в целости.

Полевая заметка: я держу узлы промптов близко к сэмплеру и отодвигаю узлы изображений вправо. Когда я смотрю на граф, я вижу «слова → латентное пространство → декодирование → сохранение». Звучит очевидно, но макет влияет на то, насколько спокойно я работаю.

Рекомендуемые значения по умолчанию

Значения по умолчанию — это то, где я экономлю время для своего будущего «я». Это значения, которые я устанавливаю и редко трогаю, если нет причины.

Модель/разрешение:

  • SD1.5: 768×768 для квадрата. Это дает больше деталей, чем 512, без перегрузки VRAM.

  • SDXL: 1024×1024, когда мне действительно нужен SDXL: в противном случае я придерживаюсь 832×1216 или 1216×832 для портретов/сцен. Делимость на 64 держит сэмплер в хорошем состоянии. Сэмплер/шаги/CFG (KSampler):

  • Сэмплер: DPM++ 2M Karras

  • Шаги: 18–24 (SD1.5), 22–28 (SDXL)

  • CFG: 4.5–6.5 в зависимости от силы промпта

Отрицательный промпт:

  • Держите небольшой, стабильный набор. Я использую «blurry, extra fingers, overlapping limbs, watermark, low-res, jpeg artifacts.» Это скучно с умыслом.

Пакетная обработка:

  • Размер пакета 2–4 при исследовании, количество пакетов 1. Если VRAM ограничен, используйте количество пакетов вместо размера пакета, чтобы избежать скачков.

Эти значения по умолчанию дают результаты, которые «достаточно хороши» и предсказуемы. Когда мне нужно что-то более четкое или стилизованное, я меняю одно за раз и откатываюсь, если это не помогает.

Настройки согласованности

Согласованность — это в основном предотвращение накопления небольших отклонений. Несколько рычагов имеют большее значение, чем остальные.

Дисциплина seed:

  • Заблокируйте seed, как только увидите направление, которое вам нравится. Я буду исследовать промпты с фиксированным seed, затем дублирую узел и пробую новый seed, чтобы проверить надежность.

Длина промпта:

  • Короткие промпты стабилизируются быстрее. Если я ловлю себя на написании абзаца, я его разбиваю: предмет, подсказка стиля, освещение. Три строки лучше одного потока сознания.

Санитария CFG:

  • Слишком высокий и вы подавляете выученную структуру модели: слишком низкий и вы получаете кашу. Большинство моих стабильных выводов находятся на CFG 5–6.

Изменения разрешения:

  • Если я увеличиваю масштаб латентного пространства в 1.5–2 раза, я сохраняю тот же seed и сэмплер. Большие скачки (например, 512→2048) меняют ощущение: я их избегаю, если только стиль это не выдержит.

Примечания версии:

  • Я протестировал это в январе 2026 года с текущими ComfyUI сборками и обычными контрольными точками SD1.5/SDXL. Планировщики развиваются, но баланс seed/CFG остается полезным во всех версиях. На практике эти привычки сокращают повторные рендеринги. За неделю я почувствовал небольшой, но реальный прирост, может быть, 3–5 минут сэкономлено на набор изображений, но что более важно, меньше сомнений в себе.

Стратегия увеличения масштаба

Я пробую два пути и выбираю более спокойный для проекта.

Путь A: увеличение масштаба латентного пространства

  • Используйте Latent Upscale (1.5× или 2×) перед VAE Decode.
  • Переиспользуйте те же настройки seed и сэмплера.
  • Плюсы: сохраняет детали логичными: дешево по памяти.
  • Минусы: если продвинуть дальше 2×, появятся артефакты.

Путь B: изменение размера изображения после декодирования

  • Сначала декодируйте, затем Image Scale до целевого (Lanczos работает хорошо), опционально легкую четкость.
  • Плюсы: быстро, предсказуемо для потребностей макета.
  • Минусы: вы растягиваете пиксели, а не придумываете новые детали.

Если я доставляю изображение размером с плакат, я иногда делаю гибрид: увеличение масштаба 1.5× латентного пространства, декодирование, затем небольшое изменение размера изображения, чтобы попасть в точные размеры. Это стабильно и избегает вида «размытого масштабирования» без погони за экзотическими узлами.

Распространенные ошибки узлов

Это препятствия, на которые я наталкиваюсь чаще всего, и как я их преодолеваю.

  • Несовпадение Model/CLIP: Если выводы выглядят «неправильно» способом, который не является стилистическим, проверьте, выровнены ли контрольная точка, CLIP и VAE. Один Checkpoint Loader помогает избежать перекрестной коммутации.
  • Размер не делится на 64: Латентному пространству нравятся чистые кратные. Если узел жалуется или изображения странно обрезаются, я округляю размеры до ближайшего 64.
  • CUDA OOM: Сначала уменьшите размер пакета. Если этого недостаточно, уменьшьте разрешение на один шаг (например, 1024→896) перед тем, как трогать шаги.
  • Seeds на самом деле не фиксированы: Некоторые графы тихо переинициализируют seeds. Я подключаю узел Seed или вводу его прямо в KSampler и смотрю на предпросмотр на предмет смещения.
  • Отрицательный промпт не подключен: Когда я забываю, я получаю более «громкие» изображения. Я держу узел отрицательного кодировщика визуально близко к положительному, чтобы избежать висячих проводов.

Ничего из этого не является драматичным, но раннее обнаружение ошибок сохраняет сеанс спокойным.

Советы по экспорту

Я не хочу искать настройки позже. Два привычка помогают.

  • Именование файлов: В Save Image я устанавливаю шаблон с seed и названием модели в имени файла. Когда клиент просит «версия 3, тот же стиль, больше», я могу отследить это.
  • Встроенный рабочий процесс: ComfyUI записывает граф в метаданные PNG. Если мне нужно поделиться или пересмотреть, я загружаю PNG обратно в ComfyUI и граф восстанавливается. Никаких дополнительных заметок не нужно.
  • Резервные копии JSON: Я все еще экспортирую JSON рабочего процесса, когда меняю что-то структурное. Один маленький шаблон на семейство моделей сохраняет чистоту.

Маленькая деталь: я храню выводы в папках с датами. Это не причудливо, но это разница между «найти за 10 секунд» и «куда это делось?»

Идея загрузки шаблона

Я думаю о том, чтобы поделиться одним шаблоном рабочего процесса ComfyUI Nano Banana Pro с двумя вкладками внутри графика: одна для SD1.5, одна для SDXL, тот же порядок узлов, те же разумные значения по умолчанию. Вы меняли бы контрольную точку, устанавливали свой промпт и выбирали увеличение масштаба латентного пространства или изображения.

Это в основном граф, который я использую сейчас, тихий, обозначенный и достаточно легкий, чтобы понять с первого взгляда. И если вы предпочитаете более тяжелые графы со стилизаторами и рефайнерами, это справедливо. Мне нравится видеть, что меняется, когда я двигаю один циферблат.

Я буду продолжать его совершенствовать. Один небольшой шаг за раз — это все еще самый быстрый способ, который я знаю, чтобы добраться до чего-то, чему я могу доверять.