← Blog

Tutorial completo de Seedream 4.0 a 5.0: Generación de texto a imagen, edición y creación de múltiples imágenes

Domina la familia de modelos Seedream de ByteDance, desde la versión 4.0 hasta la 5.0. Aprende a generar imágenes a partir de texto, editar imágenes, crear múltiples imágenes de forma secuencial, aplicar ingeniería de prompts y elegir la versión adecuada para tu flujo de trabajo.

16 min read

La familia Seedream de ByteDance ha evolucionado rápidamente desde la versión 4.0 hasta la 5.0, con cada lanzamiento aportando nuevas capacidades para la generación, edición y razonamiento inteligente de imágenes. Este tutorial cubre todo el rango 4.0–5.0: lo que cada versión hace mejor, qué variantes de modelo usar y cómo obtener resultados de calidad de producción a través de la API de WaveSpeedAI.


Descripción General de la Familia de Modelos

La línea Seedream 4.0–5.0 admite tres tipos de entrada: texto, una sola imagen y múltiples imágenes, lo que permite la generación de texto a imagen, edición de imágenes, fusión de múltiples imágenes y generación en lote secuencial con consistencia temática.

Cada versión principal tiene fortalezas distintas:

VersiónPosicionamientoMejor ParaPrecio (WaveSpeedAI)
4.0Alta EficienciaIteración rápida, pósters con conciencia de diseño, diseños en cuadrícula, producción sensible al costo$0.027/imagen
4.5Edición Profunda y TipografíaRetratos, visuales de marca, renderizado de texto nítido, composición de pósters 4K$0.04/imagen
5.0-Lite5.0 LigeroGeneración y edición 5.0 rápida, punto de entrada accesibleDisponible ahora
5.0-PreviewConocimiento y RazonamientoTemas de tendencia, búsqueda web, razonamiento lógico, contenido específico de dominioPróximamente

Seedream 4.0: Generación con Conciencia de Diseño

Seedream 4.0 está optimizado para pósters de múltiples paneles, diseños conceptuales con texto, visuales clave de series (KV) y activos para redes sociales. Destaca en diseños basados en cuadrículas, planificación de espacios en blanco para títulos y subtítulos, y mejora de la legibilidad del texto.

Especificaciones Clave

  • Salida predeterminada: 2048x2048 (2K)
  • Resolución máxima: 4096x4096
  • Velocidad de inferencia: ~1.8s para una imagen 2K
  • Relaciones de aspecto: 1:1, 3:2, 4:3, 16:9, 21:9 y personalizadas

Variantes del Modelo

Seedream 4.0 incluye cuatro variantes en WaveSpeedAI, cada una diseñada para un flujo de trabajo diferente:

bytedance/seedream-v4 — Texto a imagen. Genera imágenes a partir de indicaciones de texto. Ideal para pósters, arte conceptual y gráficos para redes sociales.

bytedance/seedream-v4/edit — Imagen a imagen. Modifica imágenes existentes: cambios de atuendo, reemplazo de fondo, cambios de material, rediseños de interiores. Admite hasta 10 imágenes de referencia.

bytedance/seedream-v4/sequential — Texto a imagen en lote. Genera múltiples imágenes a la vez con consistencia entre imágenes. Perfecto para hojas de personajes, campañas publicitarias y diagramas de pasos.

bytedance/seedream-v4/edit-sequential — Imagen a imagen en lote. Entrada de múltiples imágenes con salida en lote. Permite la fusión de múltiples imágenes, transferencias de estilo en conjuntos y comparaciones de variantes A/B.

Indicaciones de Texto a Imagen (V4)

Al crear indicaciones para Seedream 4.0, especifica el sujeto, el diseño (cuadrícula, tríptico, etc.), la colocación del texto (título, subtítulo, CTA) y el estilo preferido.

Póster en Cuadrícula 2x2

Diseño de póster en cuadrícula 2x2, márgenes limpios para tipografía, título en la parte superior central:
"SUMMER COLLECTION", subtítulo: "New Arrivals 2026". Panel 1: resort junto al mar;
Panel 2: cóctel al atardecer; Panel 3: flores tropicales; Panel 4: olas del océano.
Gradación de color consistente, iluminación cinematográfica, color de marca #3CA2F6,
fondo de alta legibilidad, mínimo desorden

Tríptico

Paneles de tríptico horizontal, narrativa de izquierda a derecha: amanecer en la montaña ->
sendero de senderismo -> celebración en la cima, paleta unificada de tonos tierra cálidos,
viñeta suave, canalones claros, fuerte jerarquía tipográfica,
espacio reservado para CTA "START YOUR ADVENTURE"

Póster Minimalista

Póster minimal, título grande al centro: "INNOVATION SUMMIT", subtítulo pequeño
debajo: "March 2026 • San Francisco", objeto focal único: escultura geométrica abstracta,
monocromático + acento #3CA2F6, fondo de alta legibilidad,
diseño basado en cuadrícula

Tira Cómica

Diseño de tira cómica de 4 paneles, marcadores de posición para globos de diálogo.
Panel 1: desarrollador mira la pantalla; Panel 2: IA genera solución;
Panel 3: desarrollador celebra; Panel 4: "¿Era así de fácil?"
Arte lineal en negrita, sombreado plano, canalones claros, alta legibilidad

Ejemplo de API: Texto a Imagen

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4",
    {"prompt": "2x2 grid poster, title: 'TECH EXPO 2026', four futuristic product concepts, clean margins, cinematic lighting, brand color blue"},
)

print(output["outputs"][0])

Edición de Imágenes (V4 Edit)

La variante de edición modifica imágenes existentes preservando la identidad del sujeto, la iluminación y la composición. Usa indicaciones claras y estructuradas siguiendo el patrón: acción + objeto + característica objetivo + restricciones.

Cambio de Atuendo

Cambio de atuendo para retrato, reemplazar ropa con elegante blazer azul marino;
mantener pose y composición; accesorios: reloj dorado;
maquillaje/cabello sin cambios; preservar tono de piel e iluminación;
bordes limpios, sin artefactos

Reemplazo de Fondo

Reemplazo de fondo para sujeto, mantener bordes del sujeto;
nuevo entorno: oficina moderna con ventanas de piso a techo;
coincidir dirección de luz y temperatura de color;
sombras de contacto suaves; sin halos

Rediseño de Interiores

Cambio de acabado interior, actualizar pared a ladrillo expuesto,
piso a madera oscura, tapicería de muebles a lino carbón;
diseño e iluminación sin cambios; texturas PBR realistas

Ejemplo de API: Edición de Imágenes

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Replace the background with a tropical beach at sunset, match light direction, soft shadows",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])

Generación Secuencial (V4 Sequential)

La variante secuencial genera múltiples imágenes en una sola llamada con estilo, identidad y paleta consistentes en todo el conjunto. Debes especificar el número de imágenes tanto en la indicación como en el parámetro max_images.

Hoja de Diseño de Personaje

Generar 6 hojas de personaje de un hacker cyberpunk.
Imagen 1: pose neutral; Imagen 2: pose de acción; Imagen 3: perfil lateral;
Imagen 4: vista trasera; Imagen 5: expresión feliz; Imagen 6: expresión seria.
Mismo atuendo y paleta, estilo de rotación limpio.

Campaña Publicitaria

Generar 4 conceptos de póster de la misma campaña de marca de café.
Imagen 1: titular "WAKE UP", luz matutina;
Imagen 2: titular "FUEL UP", energía de tarde;
Imagen 3: titular "WIND DOWN", calidez vespertina;
Imagen 4: titular "DREAM ON", ambiente nocturno.
Mantener color de marca marrón/dorado, cuadrícula y márgenes consistentes, iluminación cinematográfica.

Ejemplo de API: Generación Secuencial

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Generate 4 images of a sneaker in different colorways. Image 1: white/blue; Image 2: black/gold; Image 3: red/white; Image 4: green/cream. Studio lighting, identical angle and composition, clean background.",
        "max_images": 4,
    },
)

for url in output["outputs"]:
    print(url)

Nota sobre costos: El modelo secuencial cobra por max_images, no por la salida real. Si estableces max_images=4 pero solo describes 2 imágenes en tu indicación, se te cobrará por 4 de todas formas. Siempre coincide el número en tu indicación con max_images.


Seedream 4.5: Tipografía y Edición Profunda

Seedream 4.5 se basa en la versión 4.0 con mejoras significativas en renderizado de texto, adherencia a indicaciones, calidad estética y consistencia con imágenes de referencia. Es la opción recomendada para cualquier trabajo que involucre tipografía, visuales de marca o edición de retratos.

Mejoras Clave Sobre la Versión 4.0

  • Tipografía mejorada: Texto nítido y legible para pósters, logotipos, UI y diseños de marketing
  • Composición a nivel de diseñador: Maneja diseños complejos estilo póster con jerarquía clara
  • Mayor adherencia a indicaciones: Sigue de cerca las descripciones detalladas de sujetos, diseño y estilo
  • Mayor resolución: Admite desde 2560x1440 hasta 4096x4096 (mínimo más alto que V4)
  • Mejor consistencia de referencia: Preserva rasgos faciales, iluminación y tono de color de las imágenes de referencia

Variantes del Modelo

Al igual que V4, Seedream 4.5 ofrece cuatro variantes en WaveSpeedAI:

VarianteRuta del ModeloTipoCaso de Uso
Basebytedance/seedream-v4.5Texto a ImagenPósters con mucha tipografía, visuales de marca
Editbytedance/seedream-v4.5/editImagen a ImagenEdición de retratos, retoque de productos
Sequentialbytedance/seedream-v4.5/sequentialLote T2ISeries consistentes, conjuntos de campaña
Edit-Sequentialbytedance/seedream-v4.5/edit-sequentialLote I2IFusión de múltiples imágenes, transferencias de estilo

Resoluciones Recomendadas (V4.5)

Relación de AspectoResolución Sugerida
1:12048x2048
4:32688x2016
3:22688x1792
16:92560x1440
Cuadrado 4K4096x4096

Mejores Prácticas para Renderizado de Texto

La característica destacada de Seedream 4.5 es la generación precisa de texto dentro de las imágenes. Sigue estas pautas para obtener mejores resultados:

  1. Usa comillas dobles alrededor del texto que debe aparecer en la imagen: Generar un póster con el título "Seedream 4.5"
  2. Especifica las características de la fuente: “sans-serif en negrita”, “script elegante”, “manuscrito”
  3. Describe la ubicación del texto: “título arriba al centro”, “subtítulo debajo”, “CTA abajo a la derecha”
  4. Mantén el texto corto: Las palabras de 1 a 10 funcionan mejor; los párrafos largos pueden tener inconsistencias
  5. Usa resoluciones más altas: 2048x2048 o superior proporciona tipografía notablemente más limpia

Ejemplo: Póster de Marca

Póster minimalista de conferencia tecnológica, fondo azul marino oscuro.
Título grande en blanco en mayúsculas en la parte superior: "AI SUMMIT 2026".
Subtítulo gris pequeño debajo: "San Francisco • June 15-17".
Forma geométrica holográfica abstracta centrada.
Acento de color de marca #3CA2F6. Diseño de cuadrícula limpio, espacio en blanco generoso.

Ejemplo de API: Generación con Mucha Tipografía

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {
        "prompt": "Coffee shop menu board, chalkboard style, title 'DAILY SPECIALS' in bold chalk lettering, items: Espresso $3, Latte $4, Cappuccino $4.50, warm ambient lighting, cozy cafe atmosphere",
        "size": "2048x2048",
    },
)

print(output["outputs"][0])

Generación Basada en Referencia (V4.5 Edit)

Seedream 4.5 Edit destaca en extraer y preservar características visuales de imágenes de referencia:

Transferencia de Gradación de Color

Cambiar el tono de color de la Imagen 1 para que coincida con el tono de color de la Imagen 2

Transferencia de Maquillaje

Transferir el maquillaje de la Imagen 2 a la persona en la Imagen 1

Aplicación de Estilo de Marca

Aplicar el estilo de diseño de marca de la Imagen 1 al producto en la Imagen 2,
crear una imagen promocional de serie de marca similar,
incluir todos los módulos de diseño de la Imagen 1

Seedream 5.0-Preview: Inteligencia y Razonamiento

Seedream 5.0-Preview introduce capacidades que van más allá de la generación de imágenes tradicional. Prioriza el conocimiento y la inteligencia sobre la estética pura, añadiendo búsqueda web en tiempo real, control de edición preciso y razonamiento lógico avanzado.

Nota: Para belleza visual pura y fotorrealismo, Seedream 4.5 sigue siendo la opción recomendada. El lanzamiento completo de la versión 5.0 combinará tanto inteligencia como estética.

Búsqueda Web en Tiempo Real

5.0-Preview es el primer modelo de generación de imágenes en admitir generación basada en búsqueda. El modelo determina de forma inteligente cuándo buscar según tu indicación:

  • Términos sensibles al tiempo: Lanzamientos de productos recientes, eventos actuales
  • Entidades específicas: Celebridades, marcas, ubicaciones
  • Consultas de cola larga: Temas especializados que requieren precisión factual

Indicaciones de ejemplo que activan la búsqueda:

Generar concepto de diseño del iPhone 17 Pro Max
Hacer referencia a la interfaz de la aplicación Duolingo, diseñar una
página de tarjetas de vocabulario con contador de palabras y rachas, incorporar
la mascota del búho verde
Generar un póster de los Juegos Olímpicos de Invierno Nórdico: fondo de aurora noruega,
esquiador en uniforme nacional, incluir elementos olímpicos y mascota

Razonamiento Lógico Inteligente

5.0-Preview maneja operaciones complejas que requieren comprensión del contexto y toma de decisiones en múltiples pasos:

Clasificación y Distribución

Clasificar las flores en la Imagen 1 por variedad, organizarlas
por separado en los tres jarrones mostrados en la Imagen 2

Comprensión del Mundo Físico

Dos reglas de papelería, la de arriba es una regla de plástico de 20cm,
la de abajo es una regla de acero de 10cm

Razonamiento 3D

Generar la forma ensamblada en 3D basada en el diagrama
de diseño plano del empaque

Conocimiento Específico de Dominio

Hacer referencia a este conjunto de dibujos CAD, generar una visualización
realista del edificio
Diagrama de vista anterior del sistema respiratorio humano que muestra:
cavidad nasal, fosas nasales, cavidad oral, faringe, laringe,
tráquea, bronquios principales izquierdo y derecho, pulmones
izquierdo y derecho, y diafragma

Edición Basada en Ejemplos

En lugar de describir transformaciones complejas, muestra al modelo lo que deseas con ejemplos de antes/después:

Hacer referencia al cambio de la Imagen 1 a la Imagen 2, aplicar la
misma operación a la Imagen 3

Esto funciona para cambios de peinado, intercambios de escenas, transformaciones de materiales y cambios de perspectiva.


Guía de Ingeniería de Indicaciones

Estos consejos se aplican a todas las versiones de Seedream 4.0–5.0.

Usa Lenguaje Natural, No Listas de Etiquetas

Escribe narrativas coherentes en lugar de listas de palabras clave fragmentadas:

Evitar:

chica, vestido lujoso, sombrilla, camino arbolado, pintura al óleo, estilo Monet

Preferir:

Una chica con un vestido lujoso caminando bajo una sombrilla por un camino arbolado,
al estilo de una pintura al óleo de Monet

Fórmula de Estructura de Indicación

[Sujeto] + [Acción/Pose] + [Entorno/Escenario] + [Estilo] + [Detalles Técnicos] + [Contenido de Texto]

Ejemplo:

Un barista profesional (sujeto) creando arte latte (acción) en una moderna
cafetería especializada (entorno), estilo fotorrealista (estilo),
luz cálida de la mañana a través de grandes ventanas, poca profundidad de campo (técnico),
una pizarra detrás de ellos que dice "ARTISAN ROASTERS" (contenido de texto)

Indicaciones de Edición

Para la edición de imágenes, usa instrucciones específicas e inequívocas que indiquen explícitamente qué cambia y qué permanece igual:

Evitar: Hazlo ver mejor

Preferir: Reemplazar el cielo nublado con un fondo de atardecer vívido, tonos naranja cálidos; mantener el edificio y el primer plano sin cambios

Marcado Visual para Ediciones Complejas

Cuando las descripciones de texto solas no son suficientes para un posicionamiento preciso, usa flechas, cuadros delimitadores o garabatos en la imagen de referencia para designar regiones específicas para modificación.

Errores Comunes

  1. Instrucciones conflictivas: “Personaje de dibujos animados fotorrealista” — elige una dirección de estilo
  2. Complicar demasiado las indicaciones: Comienza simple, agrega detalles de forma incremental
  3. Ignorar la relación de aspecto: Adapta las dimensiones a tu caso de uso (cuadrado para redes sociales, horizontal para banners)
  4. Instrucciones de edición vagas: Evita pronombres como “cámbialo” — especifica qué es “eso”

Elegir la Versión Correcta

Guía de Decisión Rápida

  • ¿Necesitas velocidad y bajo costo? → Seedream 4.0
  • ¿Necesitas texto nítido en las imágenes? → Seedream 4.5
  • ¿Necesitas pósters de calidad de marca? → Seedream 4.5
  • ¿Necesitas conjuntos de múltiples imágenes consistentes? → V4 o V4.5 Sequential
  • ¿Necesitas editar fotos existentes? → V4 o V4.5 Edit
  • ¿Necesitas imágenes de eventos actuales? → Seedream 5.0-Preview
  • ¿Necesitas contenido basado en conocimiento? → Seedream 5.0-Preview

Comparación Detallada

Capacidad4.04.55.0-Preview
Texto a Imagen
Edición de ImagenSí (mejor)
Múltiples Imágenes
Generación Secuencial
Renderizado de TextoBuenoExcelenteBueno
Búsqueda WebNoNo
Razonamiento LógicoBásicoBásicoAvanzado
Resolución Máxima4096x40964096x40964K
Resolución Mínima~320x3202560x1440
VelocidadMás rápidaModeradaModerada
Costo$0.027$0.04

Limitaciones de Versión

Seedream 4.0: El texto pequeño puede repetirse o degradarse; la precisión de edición es menor que la versión 4.5.

Seedream 4.5: Ocasionales problemas de desenfoque o recorte; mayor costo y tiempo de generación que la versión 4.0.

Seedream 5.0-Preview: Cierta apariencia generada por IA; ocasionales problemas de proporción; inestabilidad en la estructura del texto; razonamiento limitado de gráficos/datos. Actualmente prioriza la inteligencia sobre la estética.


Todos los Modelos Disponibles en WaveSpeedAI

ModeloTipoPrecioMejor Para
bytedance/seedream-v4Texto a Imagen$0.027Pósters, diseños en cuadrícula, diseños conceptuales
bytedance/seedream-v4/editImagen a Imagen$0.027Cambios de atuendo, cambios de fondo, retoque
bytedance/seedream-v4/sequentialLote T2I$0.027/imagenHojas de personajes, conjuntos de campaña
bytedance/seedream-v4/edit-sequentialLote I2I$0.027/imagenFusión de múltiples imágenes, variantes A/B
bytedance/seedream-v4.5Texto a Imagen$0.04Tipografía, visuales de marca, pósters 4K
bytedance/seedream-v4.5/editImagen a Imagen$0.04Edición de retratos, transferencia de estilo/características
bytedance/seedream-v4.5/sequentialLote T2I$0.04/imagenSeries de marca, campañas consistentes
bytedance/seedream-v4.5/edit-sequentialLote I2I$0.04/imagenEdición de múltiples imágenes, exploración de diseño
bytedance/seedream-v5.0-liteTexto a Imagen$0.035Generación basada en conocimiento, búsqueda web
bytedance/seedream-v5.0-lite/editImagen a Imagen$0.035Edición inteligente, transferencia de características
bytedance/seedream-v5.0-lite/sequentialLote T2I$0.035/imagenSeries inteligentes consistentes
bytedance/seedream-v5.0-lite/edit-sequentialLote I2I$0.035/imagenEdición inteligente de múltiples imágenes

Primeros Pasos

  1. Regístrate en WaveSpeedAI y obtén tu clave de API
  2. Instala el SDK: pip install wavespeed
  3. Elige tu modelo basándote en la guía de decisión anterior
  4. Escribe tu indicación usando la fórmula de estructura y las mejores prácticas
  5. Genera e itera: Refina las indicaciones según los resultados
import wavespeed

# Texto a Imagen con Seedream 4.5
output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {"prompt": "A sleek product showcase poster, title 'NEXT GEN' in bold white sans-serif, dark gradient background, floating smartphone with holographic screen, cinematic lighting, brand color #3CA2F6"},
)

print(output["outputs"][0])
import wavespeed

# Edición de Imagen con Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Change the outfit to a formal black suit, keep the same pose and background lighting",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])
import wavespeed

# Generación Secuencial con Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Generate 3 step-by-step tutorial visuals for making pour-over coffee. Image 1: grinding beans; Image 2: pouring water in circular motion; Image 3: finished cup with steam. Uniform warm style, numbered labels.",
        "max_images": 3,
    },
)

for url in output["outputs"]:
    print(url)

Ya sea que estés construyendo automatización de marketing, creando contenido para redes sociales a escala o desarrollando aplicaciones creativas, la familia Seedream 4.0–5.0 en WaveSpeedAI proporciona el espectro completo desde la iteración rápida hasta la generación inteligente basada en conocimiento.