Flux de travail ComfyUI Nano Banana Pro : Installation, nœuds et paramètres optimaux

Flux de travail ComfyUI Nano Banana Pro : Installation, nœuds et paramètres optimaux

vous regardez le graphique de nœuds ComfyUI, Nano Banana Pro installé mais rien ne semble fonctionner correctement—ça vous dit quelque chose? Imaginez ceci: une installation propre, tous les nœuds clés placés correctement, et les meilleurs paramètres par défaut qui règlent déjà votre première exécution d’inférence sans ajustements. Je suis votre ami, Dora. J’ai parcouru ce chemin plusieurs fois, et dans cet article nous allons marcher à travers l’installation, les configurations de nœuds essentiels, et les paramètres par défaut qui transforment la confusion en flux de travail fluide.

Quand ComfyUI en vaut la peine

Je recours à ComfyUI quand j’ai besoin d’un contrôle qui ne me pose pas de problèmes plus tard, du routage de prompts, des seeds, des résolutions, et une façon propre de répéter un résultat. Le texte vers image dans une seule boîte est rapide, mais les petits changements deviennent confus. Dans ComfyUI, je peux voir ce qui se passe et ajuster une chose à la fois.

Quelques cas où cela en vaut la peine:

  • Itérer sur un style visuel où le seed compte et où je devrai le reproduire la semaine prochaine.
  • Mélanger des modèles SDXL et SD1.5 le même jour et ne pas vouloir réapprendre une interface à chaque fois.
  • Garder un enregistrement de la façon dont une image a été créée. ComfyUI écrit le graphique dans les métadonnées PNG par défaut. C’est de l’or.

Je n’ouvre pas ComfyUI pour un rapide tableau de style ou des miniatures jetables. Il brille quand le chemin du prompt à la sortie doit être lisible. Le flux de travail ComfyUI Nano Banana Pro vit dans cette zone: assez petit pour se charger en secondes, assez clair pour que le Moi Futur ne maudisse pas le Moi Passé.

Si vous avez jamais besoin du même type de prévisibilité côté API—routage fixe, pas d’échange de modèle surprise, visibilité d’utilisation claire—notre accent WaveSpeed sur le maintien de l’accès aux modèles stable et transparent, donc l’infrastructure ne devient pas une autre chose que vous devez surveiller.

➡️Essayez Wavespeed ici!

Graphique de nœuds minimal

J’ai réduit le graphique jusqu’à ce que retirer un nœud de plus le rend pire. Le cœur est le même pour SD1.5 et SDXL: je change simplement le checkpoint et la résolution.

Voici la colonne vertébrale sur laquelle j’ai atterri:

  • Checkpoint Loader (modèle + CLIP + VAE ensemble)
  • CLIP Text Encode (positif)
  • CLIP Text Encode (négatif)
  • Empty Latent Image (taille, lot)
  • KSampler (sampler, étapes, CFG, seed)
  • VAE Decode
  • Save Image

Optionnel, mais toujours léger:

  • Latent Upscale (si je veux des images plus grandes sans ré-échantillonnage à partir de zéro)
  • Image Scale (pour le redimensionnement de pixels final)

La victoire silencieuse ici est un KSampler par rendu. J’ai essayé d’enchaîner des affineurs et des planificateurs sophistiqués, mais le graphique est devenu bruyant et les résultats moins prévisibles. Avec ce petit équipement minimal, je peux changer les modèles et garder ma carte mentale intacte.

Note de terrain: je garde les nœuds de prompt proches du sampler et je pousse les nœuds d’image vers la droite. Quand je regarde le graphique, je peux voir “mots → latent → decode → save.” Ça semble évident, mais la disposition affecte la façon dont je travaille calmement.

Paramètres par défaut recommandés

Les paramètres par défaut sont où j’économise le plus de temps à mon moi futur. Ce sont les valeurs que je définis et que je ne touche presque jamais à moins qu’il n’y ait une raison.

Modèle/résolution:

  • SD1.5: 768×768 pour le carré. Cela donne plus de détails que 512 sans forcer la VRAM.

  • SDXL: 1024×1024 quand j’ai vraiment besoin de SDXL: sinon je m’en tiens à 832×1216 ou 1216×832 pour les portraits/scènes. Divisible par 64 rend le sampler heureux. Sampler/étapes/CFG (KSampler):

  • Sampler: DPM++ 2M Karras

  • Étapes: 18–24 (SD1.5), 22–28 (SDXL)

  • CFG: 4,5–6,5 selon la force du prompt

Prompt négatif:

  • Gardez un ensemble petit et stable. J’utilise “blurry, extra fingers, overlapping limbs, watermark, low-res, jpeg artifacts.” C’est ennuyeux à dessein.

Traitement par lots:

  • Taille de lot 2–4 lors de l’exploration, nombre de lots 1. Si la VRAM est limitée, utilisez le nombre de lots au lieu de la taille de lot pour éviter les pics.

Ces paramètres par défaut produisent des résultats qui sont “assez bons” et prévisibles. Quand j’ai besoin de quelque chose de plus net ou plus stylisé, je change une chose à la fois et je l’annule si cela n’aide pas.

Paramètres de cohérence

La cohérence concerne surtout le fait de ne pas laisser les petites variations s’accumuler. Quelques leviers comptent plus que les autres.

Discipline des seeds:

  • Verrouillez le seed une fois que vous voyez une direction qui vous plaît. J’explorerai les prompts avec un seed fixe, puis je dupliquerai le nœud et essayerai un nouveau seed pour vérifier la robustesse.

Longueur du prompt:

  • Les prompts courts se stabilisent plus rapidement. Si je me surprends à écrire un paragraphe, je le divise: sujet, conseil de style, éclairage. Trois lignes valent mieux qu’un seul discours.

Santé du CFG:

  • Trop élevé et vous effacez la structure apprise du modèle: trop bas et vous obtenez de la bouillie. La plupart de mes résultats stables se situent à CFG 5–6.

Changements de résolution:

  • Si je mets à l’échelle les latents de 1,5–2×, je conserve le même seed et sampler. Les gros sauts (comme 512→2048) changent le ressenti: je les évite à moins que le style puisse le supporter.

Notes de version:

  • J’ai testé cela en janvier 2026 avec les dernières versions ComfyUI et les checkpoints SD1.5/SDXL communs. Les planificateurs évoluent, mais l’équilibre seed/CFG reste utile d’une version à l’autre. En pratique, ces habitudes réduisent les ré-rendus. Sur une semaine, j’ai ressenti un petit gain mais réel, peut-être 3–5 minutes économisées par ensemble d’images, mais plus important encore, moins d’autodoute.

Stratégie de mise à l’échelle

J’essaie deux chemins et je choisis le plus calme pour le projet.

Chemin A: mise à l’échelle latente

  • Utilisez Latent Upscale (1,5× ou 2×) avant VAE Decode.
  • Réutilisez les mêmes paramètres de seed et de sampler.
  • Avantages: garde les détails cohérents: bon marché en mémoire.
  • Inconvénients: poussez-le au-delà de 2× et des artefacts apparaissent.

Chemin B: redimensionnement d’image après décodage

  • Décodez d’abord, puis Image Scale jusqu’à la cible (Lanczos fonctionne bien), optionnellement un léger aiguisage.
  • Avantages: rapide, dimensionnement prévisible pour les besoins de mise en page.
  • Inconvénients: vous étirez les pixels, vous n’inventez pas de nouveaux détails.

Si je livre une image de la taille d’une affiche, je ferai parfois un hybride: mise à l’échelle latente 1,5×, décodage, puis un petit redimensionnement d’image pour atteindre les dimensions exactes. C’est stable et évite l’aspect “upscale barbouillé” sans chasser les nœuds exotiques.

Erreurs de nœud courantes

Ce sont les accrocs que j’attrape les plus souvent, et comment je les contourne.

  • Incompatibilité modèle/CLIP: Si les résultats semblent “bizarres” d’une manière qui n’est pas stylistique, vérifiez que le checkpoint, le CLIP et le VAE sont alignés. Le Checkpoint Loader unique aide à éviter les interférences croisées.
  • Taille non divisible par 64: Les latents aiment les multiples propres. Si un nœud se plaint ou que les images sont recadrées bizarrement, j’arrondis les dimensions au 64 le plus proche.
  • CUDA OOM: Baissez la taille de lot en premier. Si cela ne suffit pas, baissez la résolution d’une étape (par exemple, 1024→896) avant de toucher aux étapes.
  • Les seeds ne sont pas réellement fixés: Certains graphiques réinitialisent les seeds silencieusement. Je câble un nœud Seed ou le dactylographie directement dans KSampler et je regarde l’aperçu pour détecter les dérives.
  • Prompt négatif non connecté: Quand j’oublie, j’obtiens des images plus “fortes”. Je garde le nœud encodeur négatif visuellement proche de celui positif pour éviter les fils traînants.

Rien de cela n’est dramatique, mais les attraper tôt garde la session calme.

Conseils d’exportation

Je ne veux pas chasser les paramètres plus tard. Deux habitudes aident.

  • Nommage des fichiers: Dans Save Image, je définis un motif avec seed et nom du modèle dans le nom du fichier. Quand un client demande “version 3, même style, plus grand”, je peux le retrouver.
  • Flux de travail intégré: ComfyUI écrit le graphique dans les métadonnées PNG. Si j’ai besoin de partager ou de revisiter, je recharge le PNG dans ComfyUI et le graphique se reconstruit. Aucune note supplémentaire nécessaire.
  • Sauvegardes JSON: J’exporte toujours le JSON du flux de travail quand je change quelque chose de structurel. Un petit modèle par famille de modèles garde les choses propres.

Petit détail: je garde les résultats dans des dossiers datés. Ce n’est pas sophistiqué, mais c’est la différence entre “l’avoir trouvé en 10 secondes” et “où est-ce allé?”

Idée de téléchargement de modèle

Je pense à partager un seul modèle ComfyUI Nano Banana Pro Workflow avec deux onglets à l’intérieur du graphique: un dimensionné pour SD1.5, un pour SDXL, même ordre de nœuds, mêmes paramètres sensés. Vous échangeriez le checkpoint, définiriez votre prompt, et choisiriez la mise à l’échelle latente ou d’image.

C’est essentiellement le graphique que j’utilise maintenant, discret, étiqueté, et assez léger pour être compris en un coup d’œil. Et si vous préférez des graphiques plus lourds avec des styliseurs et des affineurs, c’est correct. J’aime voir ce qui change quand je tourne un cadran.

Je continuerai à l’affiner. Un petit changement à la fois est toujours la façon la plus rapide que je connaisse pour arriver à quelque chose auquel je peux faire confiance.