ComfyUI Nano Banana Pro Workflow: Instalasi, Node, dan Default Terbaik

ComfyUI Nano Banana Pro Workflow: Instalasi, Node, dan Default Terbaik

Anda menatap ComfyUI node graph, Nano Banana Pro sudah diinstal tetapi seolah-olah tidak ada yang berfungsi dengan baik—terdengar familiar? Bayangkan ini: instalasi bersih, semua node penting ditempatkan dengan tepat, dan default terbaik yang sudah menyelesaikan run inferensi pertama Anda tanpa tweak. Saya teman Anda, Dora. Saya telah melewati jalan ini berkali-kali, dan dalam artikel ini kami akan memandu Anda melalui instalasi, setup node penting, dan default yang mengubah kebingungan menjadi workflow yang lancar.

Ketika ComfyUI layak digunakan

Saya mencapai ComfyUI ketika saya membutuhkan kontrol yang tidak melawan saya nanti, prompt routing, seed, resolusi, dan cara bersih untuk mengulangi hasil. Text-to-image dalam satu kotak itu cepat, tetapi perubahan kecil menjadi keruh. Di ComfyUI, saya dapat melihat apa yang terjadi dan menyesuaikan satu hal pada satu waktu.

Beberapa kasus di mana ini menguntungkan:

  • Iterasi pada gaya visual di mana seed penting dan saya akan memerlukan untuk mereproduksinya minggu depan.
  • Mencampur model SDXL dan SD1.5 dalam hari yang sama dan tidak ingin belajar UI lagi setiap kali.
  • Menyimpan catatan tentang bagaimana gambar dibuat. ComfyUI menulis graph ke metadata PNG secara default. Itu sangat berharga.

Saya tidak membuka ComfyUI untuk moodboard cepat atau thumbnail sekali pakai. Ini bersinar ketika jalan dari prompt ke output harus dapat dibaca. Workflow ComfyUI Nano Banana Pro hidup di zona itu: cukup kecil untuk dimuat dalam hitungan detik, cukup jelas sehingga Future Me tidak akan mengomel pada Past Me.

Jika Anda pernah membutuhkan jenis predictability yang sama di sisi API — routing tetap, tidak ada perubahan model yang mengejutkan, visibility penggunaan yang jelas — fokus WaveSpeed kami adalah menjaga akses model tetap stabil dan transparan, sehingga infrastruktur tidak menjadi hal lain yang harus Anda lihat.

➡️Coba Wavespeed di sini!

Minimal node graph

Saya menyederhanakan graph sampai menghapus satu node lagi membuatnya lebih buruk. Inti sama untuk SD1.5 dan SDXL: saya hanya menukar checkpoint dan resolusi.

Berikut adalah spine yang saya dapatkan:

  • Checkpoint Loader (model + CLIP + VAE bersama-sama)
  • CLIP Text Encode (positif)
  • CLIP Text Encode (negatif)
  • Empty Latent Image (ukuran, batch)
  • KSampler (sampler, steps, CFG, seed)
  • VAE Decode
  • Save Image

Opsional, tetapi tetap ringan:

  • Latent Upscale (jika saya ingin gambar lebih besar tanpa re-sampling dari awal)
  • Image Scale (untuk resize pixel akhir)

Kemenangan yang tenang di sini adalah satu KSampler per render. Saya mencoba merantai refiner dan scheduler yang mewah, tetapi graph menjadi berisik dan output menjadi kurang dapat diprediksi. Dengan rig minimal ini, saya dapat menukar model dan mempertahankan peta mental saya tetap utuh.

Field note: Saya menjaga prompt node dekat dengan sampler dan mendorong image node ke kanan. Ketika saya melirik graph, saya dapat melihat “kata-kata → latent → decode → save.” Terdengar jelas, tetapi layout mempengaruhi seberapa tenang saya bekerja.

Default yang direkomendasikan

Default adalah di mana saya menghemat waktu saya di masa depan paling banyak. Ini adalah nilai yang saya atur dan jarang disentuh kecuali ada alasan.

Model/resolusi:

  • SD1.5: 768×768 untuk square. Ini memberikan lebih banyak detail daripada 512 tanpa membebani VRAM.

  • SDXL: 1024×1024 ketika saya benar-benar membutuhkan SDXL: sebaliknya saya tetap di 832×1216 atau 1216×832 untuk portrait/scene. Dapat dibagi dengan 64 membuat sampler senang. Sampler/steps/CFG (KSampler):

  • Sampler: DPM++ 2M Karras

  • Steps: 18–24 (SD1.5), 22–28 (SDXL)

  • CFG: 4,5–6,5 tergantung pada kekuatan prompt

Negative prompt:

  • Pertahankan set yang kecil dan stabil. Saya menggunakan “blurry, extra fingers, overlapping limbs, watermark, low-res, jpeg artifacts.” Ini membosankan dengan sengaja.

Batching:

  • Batch size 2–4 saat exploring, batch count 1. Jika VRAM ketat, gunakan batch count alih-alih batch size untuk menghindari lonjakan.

Default ini menghasilkan hasil yang “cukup baik” dan dapat diprediksi. Ketika saya membutuhkan sesuatu yang lebih tajam atau lebih bergaya, saya mengubah satu hal pada satu waktu dan mengembalikannya jika tidak membantu.

Consistency settings

Konsistensi sebagian besar tentang tidak membiarkan drift kecil bertambah. Beberapa lever lebih penting daripada yang lain.

Seed discipline:

  • Kunci seed setelah Anda melihat arah yang Anda sukai. Saya akan mengeksplorasi prompt dengan seed tetap, kemudian menduplikasi node dan mencoba seed baru untuk memeriksa robustness.

Prompt length:

  • Prompt pendek stabil lebih cepat. Jika saya menangkap diri saya menulis paragraf, saya membaginya: subject, style hint, lighting. Tiga baris lebih baik daripada satu omong kosong.

CFG sanity:

  • Terlalu tinggi dan Anda mencetak struktur yang dipelajari model: terlalu rendah dan Anda mendapatkan bubur. Sebagian besar output stabil saya mendarat di CFG 5–6.

Resolution changes:

  • Jika saya upscale latent sebesar 1,5–2×, saya menjaga seed dan sampler yang sama. Lompatan besar (seperti 512→2048) mengubah nuansa: saya menghindarinya kecuali gaya dapat menanganinya.

Version notes:

  • Saya menguji ini pada Januari 2026 dengan ComfyUI builds saat ini dan checkpoint SD1.5/SDXL umum. Scheduler berkembang, tetapi keseimbangan seed/CFG tetap berguna di seluruh versi. Dalam praktik, kebiasaan ini mengurangi re-render. Selama seminggu, saya merasakan keuntungan kecil namun nyata, mungkin 3–5 menit disimpan per set gambar, tetapi yang lebih penting, lebih sedikit second-guessing.

Upscale strategy

Saya mencoba dua jalur dan memilih yang lebih tenang untuk proyek.

Path A: latent upscaling

  • Gunakan Latent Upscale (1,5× atau 2×) sebelum VAE Decode.
  • Gunakan kembali seed dan sampler setting yang sama.
  • Pros: menjaga detail kohesif: murah di memori.
  • Cons: dorong melampaui 2× dan artefak merayap masuk.

Path B: image resize setelah decode

  • Decode terlebih dahulu, kemudian Image Scale ke target (Lanczos bekerja dengan baik), secara opsional sharpen ringan.
  • Pros: cepat, sizing yang dapat diprediksi untuk kebutuhan layout.
  • Cons: Anda meregangkan pixel, bukan menciptakan detail baru.

Jika saya mengirimkan gambar berukuran poster, saya kadang-kadang akan melakukan hybrid: latent upscale 1,5×, decode, kemudian resize gambar kecil untuk mencapai dimensi yang tepat. Itu stabil dan menghindari tampilan “smudged upscale” tanpa mengejar node eksotis.

Common node errors

Ini adalah snag yang saya pukul paling banyak, dan bagaimana saya mendorong melewatinya.

  • Model/CLIP mismatch: Jika output terlihat “mati” dengan cara yang bukan gaya, periksa checkpoint, CLIP, dan VAE selaras. Loader Checkpoint tunggal membantu menghindari cross-wiring.
  • Ukuran tidak dapat dibagi dengan 64: Latent menyukai kelipatan yang bersih. Jika node mengeluh atau gambar memotong aneh, saya membulatkan dimensi ke 64 terdekat.
  • CUDA OOM: Kurangi batch size terlebih dahulu. Jika itu tidak cukup, turunkan resolusi satu langkah (misalnya, 1024→896) sebelum menyentuh steps.
  • Seed sebenarnya tidak tetap: Beberapa graph menginisialisasi seed diam-diam. Saya merangkai node Seed atau mengetiknya langsung ke KSampler dan menonton preview untuk drift.
  • Negative prompt tidak terhubung: Ketika saya lupa, saya mendapatkan gambar yang lebih “keras”. Saya menjaga node encoder negatif secara visual dekat dengan yang positif untuk menghindari kabel yang menggantung.

Tidak ada yang dramatis di sini, tetapi menangkap mereka lebih awal membuat sesi tetap tenang.

Export tips

Saya tidak ingin memburu setting nanti. Dua kebiasaan membantu.

  • File naming: Dalam Save Image, saya menetapkan pola dengan seed dan nama model dalam nama file. Ketika klien meminta “versi 3, gaya yang sama, lebih besar,” saya dapat melacaknya.
  • Embedded workflow: ComfyUI menulis graph ke metadata PNG. Jika saya perlu membagikan atau kembali, saya memuat PNG kembali ke ComfyUI dan graph merekonstruksi. Tidak ada catatan ekstra yang diperlukan.
  • JSON backups: Saya masih mengekspor workflow JSON ketika saya mengubah sesuatu yang struktural. Satu template kecil per keluarga model membuat segalanya bersih.

Detail kecil: Saya menyimpan output dalam folder bertanggal. Ini tidak mewah, tetapi ini adalah perbedaan antara “menemukannya dalam 10 detik” dan “di mana ini pergi?”

Template download idea

Saya telah berpikir tentang berbagi satu Nano Banana Pro ComfyUI Workflow template dengan dua tab di dalam graph: satu berukuran untuk SD1.5, satu untuk SDXL, urutan node yang sama, default sensibel yang sama. Anda akan menukar checkpoint, menetapkan prompt Anda, dan memilih latent atau image upscale.

Ini pada dasarnya graph yang saya gunakan sekarang, tenang, berlabel, dan cukup ringan untuk dipahami sekilas. Dan jika Anda lebih suka graph yang lebih berat dengan stylizer dan refiner, itu wajar. Saya suka melihat apa yang berubah ketika saya menggerakkan satu dial.

Saya akan terus memangkasnya. Satu perubahan kecil pada satu waktu masih cara tercepat yang saya tahu untuk sampai ke sesuatu yang saya percayai.