Flujo de trabajo ComfyUI Nano Banana Pro: Instalación, nodos y configuraciones predeterminadas óptimas
Estás mirando el gráfico de nodos de ComfyUI, Nano Banana Pro instalado pero nada parece funcionar bien—¿te suena familiar? Imagina esto: una instalación limpia, todos los nodos clave colocados en su lugar, y los mejores valores predeterminados ya resolviendo tu primera ejecución sin ajustes. Soy tu amiga, Dora. He recorrido este camino muchas veces, y en este artículo recorreremos la instalación, configuraciones de nodos esenciales, y los valores predeterminados que transforman la confusión en flujos de trabajo fluidos.

Cuándo vale la pena usar ComfyUI
Recurro a ComfyUI cuando necesito control que no me pelee después, enrutamiento de prompts, semillas, resoluciones, y una forma limpia de repetir un resultado. Texto a imagen en una sola caja es rápido, pero los pequeños cambios se vuelven confusos. En ComfyUI, puedo ver qué está pasando y ajustar una cosa a la vez.
Algunos casos donde vale la pena:
- Iterar sobre un estilo visual donde la semilla importa y necesitaré reproducirlo la próxima semana.
- Mezclar modelos SDXL y SD1.5 en el mismo día sin tener que reaprender una interfaz cada vez.
- Mantener un registro de cómo se hizo una imagen. ComfyUI escribe el gráfico en los metadatos PNG por defecto. Eso es oro.
No abro ComfyUI para crear tableros de inspiración rápidos o miniaturas desechables. Brilla cuando el camino del prompt a la salida debe ser legible. El flujo de trabajo Nano Banana Pro de ComfyUI vive en esa zona: lo suficientemente pequeño para cargar en segundos, lo suficientemente claro para que el Yo Futuro no maldiga al Yo Pasado.
Si alguna vez necesitas el mismo tipo de predictibilidad en el lado de la API — enrutamiento fijo, sin cambios de modelos sorpresivos, visibilidad clara del uso — nuestro enfoque WaveSpeed mantiene el acceso a modelos estable y transparente, para que la infraestructura no se convierta en otra cosa que tengas que vigilar.
Gráfico de nodos mínimo
Reduje el gráfico hasta que eliminar un nodo más lo hizo peor. El núcleo es el mismo para SD1.5 y SDXL: solo cambio el checkpoint y la resolución.
Aquí está la estructura en la que terminé:
- Checkpoint Loader (modelo + CLIP + VAE juntos)
- CLIP Text Encode (positivo)
- CLIP Text Encode (negativo)
- Empty Latent Image (tamaño, lote)
- KSampler (sampler, pasos, CFG, semilla)
- VAE Decode
- Save Image
Opcional, pero sigue siendo ligero:
- Latent Upscale (si quiero imágenes más grandes sin remuestrear desde cero)
- Image Scale (para redimensionamiento de píxeles final)
La victoria silenciosa aquí es un KSampler por renderizado. Intenté encadenar refinadores y programadores sofisticados, pero el gráfico se volvió ruidoso y los resultados menos predecibles. Con este equipo mínimo, puedo cambiar modelos y mantener intacto mi mapa mental.
Nota de campo: mantengo los nodos de prompt cerca del sampler y empujo los nodos de imagen hacia la derecha. Cuando miro el gráfico, puedo ver “palabras → latente → decodificar → guardar.” Suena obvio, pero el diseño afecta cuán calmadamente trabajo.
Valores predeterminados recomendados
Los valores predeterminados son donde más ahorro tiempo para mi yo futuro. Estos son los valores que establezco y raramente modifico a menos que haya una razón.
Modelo/resolución:
-
SD1.5: 768×768 para cuadrado. Proporciona más detalle que 512 sin tensionar la VRAM.
-
SDXL: 1024×1024 cuando realmente necesito SDXL: de lo contrario, me atengo a 832×1216 o 1216×832 para retratos/escenas. Divisible por 64 mantiene feliz al sampler.
Sampler/pasos/CFG (KSampler): -
Sampler: DPM++ 2M Karras
-
Pasos: 18–24 (SD1.5), 22–28 (SDXL)
-
CFG: 4.5–6.5 dependiendo de la intensidad del prompt
Prompt negativo:
- Mantén un conjunto pequeño y estable. Uso “blurry, extra fingers, overlapping limbs, watermark, low-res, jpeg artifacts.” Es aburrido a propósito.
Lotes:
- Tamaño de lote 2–4 al explorar, conteo de lote 1. Si la VRAM es limitada, usa conteo de lote en lugar de tamaño de lote para evitar picos.
Estos valores predeterminados producen resultados que son “lo suficientemente buenos” y predecibles. Cuando necesito algo más nítido o estilizado, cambio una cosa a la vez y la revoco si no ayuda.
Configuración de consistencia
La consistencia trata principalmente de no dejar que pequeños desvíos se compounding. Algunos controles importan más que otros.
Disciplina de semilla:
- Bloquea la semilla una vez que veas una dirección que te guste. Exploraré prompts con una semilla fija, luego duplicaré el nodo e intentaré una nueva semilla para verificar la robustez.
Longitud del prompt:
- Los prompts cortos se estabilizan más rápido. Si me encuentro escribiendo un párrafo, lo divido: sujeto, pista de estilo, iluminación. Tres líneas vencen a una ramificación.
Cordura de CFG:
- Demasiado alto y estampas la estructura aprendida del modelo: demasiado bajo y obtienes papilla. La mayoría de mis salidas estables aterrizan en CFG 5–6.
Cambios de resolución:
- Si amplío los latentes por 1.5–2×, mantengo la misma semilla y sampler. Los saltos grandes (como 512→2048) cambian la sensación: los evito a menos que el estilo pueda manejarlo.
Notas de versión:
- Probé esto en enero de 2026 con compilaciones actuales de ComfyUI y checkpoints comunes de SD1.5/SDXL. Los programadores evolucionan, pero el balance semilla/CFG sigue siendo útil en todas las versiones.
En la práctica, estos hábitos reducen re-renderizados. Durante una semana, sentí una ganancia pequeña pero real, quizás 3–5 minutos ahorrados por conjunto de imagen, pero más importante, menos dudas.
Estrategia de ampliación
Intento dos caminos y elijo el más calmado para el proyecto.
Camino A: ampliación de latentes
- Usa Latent Upscale (1.5× o 2×) antes de VAE Decode.
- Reutiliza la misma semilla y configuración de sampler.
- Pros: mantiene los detalles coherentes: barato en memoria.
- Contras: empújalo más allá de 2× y los artefactos aparecen.
Camino B: redimensionamiento de imagen después de decodificar
- Decodifica primero, luego Image Scale al destino (Lanczos funciona bien), opcionalmente un afilado ligero.
- Pros: rápido, tamaño predecible para necesidades de diseño.
- Contras: estás estirando píxeles, no inventando nuevo detalle.
Si estoy entregando una imagen de tamaño póster, a veces haré un híbrido: ampliación de latentes de 1.5×, decodificar, luego un pequeño redimensionamiento de imagen para alcanzar dimensiones exactas. Es estable y evita el aspecto de “ampliación borrosa” sin perseguir nodos exóticos.
Errores comunes de nodos
Estos son los problemas que más me encuentro, y cómo me avanzo más allá de ellos.
- Desajuste Modelo/CLIP: Si los resultados se ven “raros” de una manera que no es estilística, verifica que el checkpoint, CLIP y VAE estén alineados. El único Checkpoint Loader ayuda a evitar el intercableado cruzado.
- Tamaño no divisible por 64: A los latentes les gustan los múltiplos limpios. Si un nodo se queja o las imágenes se recortan extrañamente, redondeo las dimensiones al 64 más cercano.
- CUDA OOM: Baja el tamaño del lote primero. Si eso no es suficiente, reduce la resolución un paso (p. ej., 1024→896) antes de tocar los pasos.
- Las semillas no están realmente fijas: Algunos gráficos reinicializan las semillas silenciosamente. Conecto un nodo Seed o lo escribo directamente en KSampler y veo la vista previa para cambios.
- Prompt negativo no conectado: Cuando me olvido, obtengo imágenes “más ruidosas”. Mantengo el nodo codificador negativo visualmente cerca del positivo para evitar cables sueltos.
Nada de esto es dramático, pero detectarlo temprano mantiene la sesión calmada.
Consejos de exportación
No quiero buscar configuraciones más tarde. Dos hábitos ayudan.
- Nomenclatura de archivos: En Save Image, establezco un patrón con semilla y nombre del modelo en el nombre del archivo. Cuando un cliente pregunta por “versión 3, mismo estilo, más grande”, puedo rastrearlo.
- Flujo de trabajo incrustado: ComfyUI escribe el gráfico en los metadatos PNG. Si necesito compartir o revisitar, cargo el PNG de nuevo en ComfyUI y el gráfico se reconstruye. Sin notas extras necesarias.
- Copias de seguridad JSON: Aún exporto el JSON del flujo de trabajo cuando cambio algo estructural. Una pequeña plantilla por familia de modelos mantiene las cosas limpias.
Detalle pequeño: mantengo salidas en carpetas fechadas. No es elegante, pero es la diferencia entre “lo encontré en 10 segundos” y “¿a dónde fue?”
Idea de descarga de plantilla
He estado pensando en compartir un único flujo de trabajo Nano Banana Pro de ComfyUI con dos pestañas dentro del gráfico: una de tamaño para SD1.5, otra para SDXL, mismo orden de nodos, mismos valores predeterminados sensatos. Cambiarías el checkpoint, establecerías tu prompt, y elegirías ampliación de latentes o imagen.
Es básicamente el gráfico que uso ahora, tranquilo, etiquetado, y lo suficientemente ligero para entender de un vistazo. Y si prefieres gráficos más pesados con estilizadores y refinadores, está bien. Me gusta ver qué cambia cuando muevo un dial.
Seguiré reduciéndolo. Cambio uno pequeño a la vez sigue siendo la forma más rápida que conozco para llegar a algo en lo que confío.






