ComfyUI Nano Banana Pro Workflow: Installation, Nodes und Best Defaults

Du starrst auf den ComfyUI Node-Graphen, Nano Banana Pro ist installiert, aber nichts scheint richtig zu funktionieren – kommt dir das bekannt vor? Stell dir vor: eine saubere Installation, alle wichtigen Nodes richtig platziert, und die besten Standardwerte lösen bereits deine erste Inferenz ohne Anpassungen. Ich bin dein Freund Dora. Ich bin diesen Weg viele Male gegangen, und in diesem Artikel gehen wir gemeinsam durch Installation, essenzielle Node-Setups und die Standardwerte, die Verwirrung in reibungslose Workflows verwandeln.

Wann sich ComfyUI lohnt

Ich greifen zu ComfyUI, wenn ich Kontrolle brauche, die mir später nicht Probleme macht – Prompt-Routing, Seeds, Auflösungen und ein sauberer Weg, um ein Ergebnis zu wiederholen. Text-zu-Bild in einer einzigen Box ist schnell, aber kleine Änderungen werden unübersichtlich. In ComfyUI kann ich sehen, was passiert und eine Sache nach der anderen anpassen.

Ein paar Fälle, in denen sich das auszahlt:

An einem visuellen Stil iterieren, bei dem der Seed zählt und ich ihn nächste Woche reproduzieren muss.
SDXL und SD1.5 Modelle am selben Tag mischen und nicht jedes Mal eine neue UI erlernen wollen.
Ein Protokoll führen, wie ein Bild erstellt wurde. ComfyUI schreibt den Graphen standardmäßig in PNG-Metadaten. Das ist Gold wert.

Ich öffne ComfyUI nicht für schnelle Mood-Board-Fodder oder Wegwerf-Thumbnails. Es glänzt, wenn der Weg von Prompt zu Output verständlich sein sollte. Der ComfyUI Nano Banana Pro Workflow lebt in dieser Zone: klein genug, um in Sekunden zu laden, klar genug, dass zukünftiges Ich nicht auf bisheriges Ich verflucht.

Wenn du jemals die gleiche Art von Vorhersagbarkeit auf der API-Seite brauchst – festes Routing, keine überraschenden Modellwechsel, klare Nutzungssichtbarkeit – unser WaveSpeed-Fokus liegt darauf, den Modellzugriff stabil und transparent zu halten, damit die Infrastruktur nicht zur nächsten Sache wird, die du babysitting.

➡️Probiere Wavespeed hier!

Minimaler Node-Graph

Ich habe den Graphen reduziert, bis das Entfernen eines weiteren Nodes es schlimmer machte. Der Kern ist derselbe für SD1.5 und SDXL: Ich tausche einfach den Checkpoint und die Auflösung aus.

Hier ist die Struktur, bei der ich gelandet bin:

Checkpoint Loader (Modell + CLIP + VAE zusammen)
CLIP Text Encode (positiv)
CLIP Text Encode (negativ)
Empty Latent Image (Größe, Batch)
KSampler (Sampler, Steps, CFG, Seed)
VAE Decode
Save Image

Optional, aber immer noch leicht:

Latent Upscale (wenn ich größere Bilder will, ohne von vorne zu sampeln)
Image Scale (für finale Pixel-Größenänderung)

Der stille Gewinn hier ist ein KSampler pro Render. Ich habe versucht, schicke Refiner und Scheduler zu verketten, aber der Graph wurde chaotisch und die Outputs weniger vorhersehbar. Mit dieser minimalen Ausrüstung kann ich Modelle wechseln und meine mentale Landkarte behalten.

Feldnotiz: Ich halte die Prompt-Nodes nah am Sampler und schiebe die Image-Nodes nach rechts. Wenn ich auf den Graphen schaue, kann ich “Worte → Latent → Decode → Speichern” sehen. Es klingt offensichtlich, aber das Layout beeinflusst, wie ruhig ich arbeite.

Empfohlene Standardwerte

Standardwerte sind dort, wo ich meinem zukünftigen Ich am meisten Zeit spare. Das sind die Werte, die ich setze und selten ändere, es sei denn, es gibt einen Grund.

Modell/Auflösung:

SD1.5: 768×768 für Quadrat. Es gibt mehr Details als 512, ohne VRAM zu belasten.
SDXL: 1024×1024, wenn ich wirklich SDXL brauche: sonst bleibe ich bei 832×1216 oder 1216×832 für Porträts/Szenen. Teilbar durch 64 hält den Sampler glücklich. Sampler/Steps/CFG (KSampler):
Sampler: DPM++ 2M Karras
Steps: 18–24 (SD1.5), 22–28 (SDXL)
CFG: 4,5–6,5 je nach Prompt-Stärke

Negativer Prompt:

Halte einen kleinen, stabilen Satz. Ich benutze “blurry, extra fingers, overlapping limbs, watermark, low-res, jpeg artifacts.” Es ist absichtlich langweilig.

Batching:

Batch-Größe 2–4 beim Erkunden, Batch-Zählung 1. Wenn VRAM knapp ist, verwende Batch-Zählung anstelle von Batch-Größe, um Spitzen zu vermeiden.

Diese Standardwerte erzeugen Ergebnisse, die “gut genug” und vorhersehbar sind. Wenn ich etwas Schärferes oder Stilisierteres brauche, ändere ich eine Sache nach der anderen und rolle es zurück, wenn es nicht hilft.

Konsistenzeinstellungen

Konsistenz geht hauptsächlich darum, kleine Abweichungen nicht zusammenzulaufen zu lassen. Ein paar Hebel zählen mehr als der Rest.

Seed-Disziplin:

Sperren den Seed, sobald ich eine Richtung sehe, die mir gefällt. Ich erkunde Prompts mit festem Seed, dann dupliziere ich den Node und versuche einen neuen Seed, um Robustheit zu prüfen.

Prompt-Länge:

Kurze Prompts stabilisieren schneller. Wenn ich merke, dass ich einen Absatz schreibe, teile ich ihn auf: Subjekt, Stil-Hinweis, Beleuchtung. Drei Zeilen schlagen einen langen Text.

CFG-Verstand:

Zu hoch und du stampfst die gelernte Struktur des Modells aus: zu niedrig und du bekommst Brei. Die meisten meiner stabilen Outputs landen bei CFG 5–6.

Auflösungsänderungen:

Wenn ich Latents um 1,5–2× hochskaliere, halte ich denselben Seed und Sampler. Große Sprünge (wie 512→2048) ändern das Gefühl: Ich vermei sie, es sei denn, der Stil kann damit umgehen.

Versionsnoten:

Ich habe das im Januar 2026 mit aktuellen ComfyUI-Builds und gängigen SD1.5/SDXL-Checkpoints getestet. Scheduler entwickeln sich weiter, aber die Seed/CFG-Balance bleibt über Versionen nützlich. In der Praxis schneiden diese Gewohnheiten Re-Renders. Über eine Woche hinweg spürte ich einen kleinen, aber realen Gewinn, vielleicht 3–5 Minuten gespart pro Bildersatz, aber noch wichtiger, weniger Selbstzweifel.

Upscale-Strategie

Ich versuche zwei Wege und wähle den ruhigeren für das Projekt.

Weg A: Latent-Upscaling

Verwende Latent Upscale (1,5× oder 2×) vor VAE Decode.
Wiederverwendung derselben Seed- und Sampler-Einstellungen.
Vorteile: hält Details kohärent: günstig bei Speicher.
Nachteile: Treibe es über 2× und Artefakte schleichen sich ein.

Weg B: Bildgröße nach Decode ändern

Zuerst dekodieren, dann Image Scale zu Ziel (Lanczos funktioniert gut), optional eine leichte Schärfung.
Vorteile: schnell, vorhersehbare Größenbestimmung für Layout-Anforderungen.
Nachteile: Du streckst Pixel, erfindest keine neuen Details.

Wenn ich ein postergroßes Bild liefere, mache ich manchmal ein Hybrid: 1,5× Latent-Upscale, Dekodieren, dann eine kleine Bildgrößenänderung, um genaue Dimensionen zu erreichen. Es ist stabil und vermeidet das “verschmiertes Upscale”-Aussehen, ohne exotische Nodes zu jagen.

Häufige Node-Fehler

Das sind die Haken, die ich am meisten treffe, und wie ich sie umgehe.

Modell/CLIP-Nichtübereinstimmung: Wenn Outputs auf eine Weise “falsch” aussehen, die nicht stilistisch ist, überprüfen Sie, ob Checkpoint, CLIP und VAE ausgerichtet sind. Der einzelne Checkpoint Loader hilft, Kreuzverdrahtung zu vermeiden.
Größe nicht teilbar durch 64: Latents mögen saubere Vielfache. Wenn ein Node sich beschwert oder Bilder seltsam zuschneiden, runde ich Dimensionen zum nächsten 64er.
CUDA OOM: Senke zuerst die Batch-Größe. Wenn das nicht genug ist, senke die Auflösung um einen Schritt (z.B. 1024→896), bevor du Steps berührst.
Seeds nicht wirklich festgelegt: Einige Graphen initialisieren Seeds leise neu. Ich verdrahte einen Seed-Node oder tippe ihn direkt in KSampler ein und beobachte die Vorschau auf Drift.
Negativer Prompt nicht verbunden: Wenn ich es vergesse, bekomme ich “lautere” Bilder. Ich halte den negativen Encoder-Node visuell nah am positiven, um baumelnde Drähte zu vermeiden.

Nichts davon ist dramatisch, aber das Erkennen früh hält die Sitzung ruhig.

Export-Tipps

Ich will Einstellungen später nicht jagen. Zwei Gewohnheiten helfen.

Dateienbenennung: In Save Image setze ich ein Muster mit Seed und Modellname im Dateinamen. Wenn ein Klient nach “Version 3, gleicher Stil, größer” fragt, kann ich es zurückverfolgen.
Eingebetteter Workflow: ComfyUI schreibt den Graphen in PNG-Metadaten. Wenn ich teilen oder erneut besuchen muss, lade ich die PNG zurück in ComfyUI und der Graph wird rekonstruiert. Keine zusätzlichen Noten nötig.
JSON-Backups: Ich exportiere immer noch die Workflow-JSON, wenn ich etwas Strukturelles ändere. Ein winziger Template pro Modellfamilie hält die Dinge sauber.

Kleines Detail: Ich halte Outputs in datierten Ordnern. Es ist nicht ausgefallen, aber es ist der Unterschied zwischen “gefunden in 10 Sekunden” und “wo ist das hin?”

Template-Download-Idee

Ich habe darüber nachgedacht, einen einzigen ComfyUI Nano Banana Pro Workflow-Template mit zwei Reitern im Graphen zu teilen: einer für SD1.5 dimensioniert, einer für SDXL, gleiche Node-Reihenfolge, gleiche sane Standardwerte. Du würdest den Checkpoint austauschen, deinen Prompt setzen und Latent- oder Image-Upscale wählen.

Es ist im Grunde der Graph, den ich jetzt benutze, ruhig, beschriftet und leicht genug, um auf einen Blick zu verstehen. Und wenn du schwerere Graphen mit Stylizern und Refinern bevorzugst, das ist fair. Ich mag es zu sehen, was sich ändert, wenn ich einen Regler bewege.

Ich werde es weiter trimmen. Eine kleine Änderung nach der Zeit ist immer noch der schnellste Weg, den ich kenne, um zu etwas zu gelangen, dem ich vertraue.