Tutorial completo de Seedream 4.0 a 5.0: Generación de texto a imagen, edición y creación de múltiples imágenes
Domina la familia de modelos Seedream de ByteDance, desde la versión 4.0 hasta la 5.0. Aprende a generar imágenes a partir de texto, editar imágenes, crear múltiples imágenes de forma secuencial, aplicar ingeniería de prompts y elegir la versión adecuada para tu flujo de trabajo.
La familia Seedream de ByteDance ha evolucionado rápidamente desde la versión 4.0 hasta la 5.0, con cada lanzamiento aportando nuevas capacidades para la generación, edición y razonamiento inteligente de imágenes. Este tutorial cubre todo el rango 4.0–5.0: lo que cada versión hace mejor, qué variantes de modelo usar y cómo obtener resultados de calidad de producción a través de la API de WaveSpeedAI.
Descripción General de la Familia de Modelos
La línea Seedream 4.0–5.0 admite tres tipos de entrada: texto, una sola imagen y múltiples imágenes, lo que permite la generación de texto a imagen, edición de imágenes, fusión de múltiples imágenes y generación en lote secuencial con consistencia temática.
Cada versión principal tiene fortalezas distintas:
| Versión | Posicionamiento | Mejor Para | Precio (WaveSpeedAI) |
|---|---|---|---|
| 4.0 | Alta Eficiencia | Iteración rápida, pósters con conciencia de diseño, diseños en cuadrícula, producción sensible al costo | $0.027/imagen |
| 4.5 | Edición Profunda y Tipografía | Retratos, visuales de marca, renderizado de texto nítido, composición de pósters 4K | $0.04/imagen |
| 5.0-Lite | 5.0 Ligero | Generación y edición 5.0 rápida, punto de entrada accesible | Disponible ahora |
| 5.0-Preview | Conocimiento y Razonamiento | Temas de tendencia, búsqueda web, razonamiento lógico, contenido específico de dominio | Próximamente |
Seedream 4.0: Generación con Conciencia de Diseño
Seedream 4.0 está optimizado para pósters de múltiples paneles, diseños conceptuales con texto, visuales clave de series (KV) y activos para redes sociales. Destaca en diseños basados en cuadrículas, planificación de espacios en blanco para títulos y subtítulos, y mejora de la legibilidad del texto.
Especificaciones Clave
- Salida predeterminada: 2048x2048 (2K)
- Resolución máxima: 4096x4096
- Velocidad de inferencia: ~1.8s para una imagen 2K
- Relaciones de aspecto: 1:1, 3:2, 4:3, 16:9, 21:9 y personalizadas
Variantes del Modelo
Seedream 4.0 incluye cuatro variantes en WaveSpeedAI, cada una diseñada para un flujo de trabajo diferente:
bytedance/seedream-v4 — Texto a imagen. Genera imágenes a partir de indicaciones de texto. Ideal para pósters, arte conceptual y gráficos para redes sociales.
bytedance/seedream-v4/edit — Imagen a imagen. Modifica imágenes existentes: cambios de atuendo, reemplazo de fondo, cambios de material, rediseños de interiores. Admite hasta 10 imágenes de referencia.
bytedance/seedream-v4/sequential — Texto a imagen en lote. Genera múltiples imágenes a la vez con consistencia entre imágenes. Perfecto para hojas de personajes, campañas publicitarias y diagramas de pasos.
bytedance/seedream-v4/edit-sequential — Imagen a imagen en lote. Entrada de múltiples imágenes con salida en lote. Permite la fusión de múltiples imágenes, transferencias de estilo en conjuntos y comparaciones de variantes A/B.
Indicaciones de Texto a Imagen (V4)
Al crear indicaciones para Seedream 4.0, especifica el sujeto, el diseño (cuadrícula, tríptico, etc.), la colocación del texto (título, subtítulo, CTA) y el estilo preferido.
Póster en Cuadrícula 2x2
Diseño de póster en cuadrícula 2x2, márgenes limpios para tipografía, título en la parte superior central:
"SUMMER COLLECTION", subtítulo: "New Arrivals 2026". Panel 1: resort junto al mar;
Panel 2: cóctel al atardecer; Panel 3: flores tropicales; Panel 4: olas del océano.
Gradación de color consistente, iluminación cinematográfica, color de marca #3CA2F6,
fondo de alta legibilidad, mínimo desorden
Tríptico
Paneles de tríptico horizontal, narrativa de izquierda a derecha: amanecer en la montaña ->
sendero de senderismo -> celebración en la cima, paleta unificada de tonos tierra cálidos,
viñeta suave, canalones claros, fuerte jerarquía tipográfica,
espacio reservado para CTA "START YOUR ADVENTURE"
Póster Minimalista
Póster minimal, título grande al centro: "INNOVATION SUMMIT", subtítulo pequeño
debajo: "March 2026 • San Francisco", objeto focal único: escultura geométrica abstracta,
monocromático + acento #3CA2F6, fondo de alta legibilidad,
diseño basado en cuadrícula
Tira Cómica
Diseño de tira cómica de 4 paneles, marcadores de posición para globos de diálogo.
Panel 1: desarrollador mira la pantalla; Panel 2: IA genera solución;
Panel 3: desarrollador celebra; Panel 4: "¿Era así de fácil?"
Arte lineal en negrita, sombreado plano, canalones claros, alta legibilidad
Ejemplo de API: Texto a Imagen
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4",
{"prompt": "2x2 grid poster, title: 'TECH EXPO 2026', four futuristic product concepts, clean margins, cinematic lighting, brand color blue"},
)
print(output["outputs"][0])
Edición de Imágenes (V4 Edit)
La variante de edición modifica imágenes existentes preservando la identidad del sujeto, la iluminación y la composición. Usa indicaciones claras y estructuradas siguiendo el patrón: acción + objeto + característica objetivo + restricciones.
Cambio de Atuendo
Cambio de atuendo para retrato, reemplazar ropa con elegante blazer azul marino;
mantener pose y composición; accesorios: reloj dorado;
maquillaje/cabello sin cambios; preservar tono de piel e iluminación;
bordes limpios, sin artefactos
Reemplazo de Fondo
Reemplazo de fondo para sujeto, mantener bordes del sujeto;
nuevo entorno: oficina moderna con ventanas de piso a techo;
coincidir dirección de luz y temperatura de color;
sombras de contacto suaves; sin halos
Rediseño de Interiores
Cambio de acabado interior, actualizar pared a ladrillo expuesto,
piso a madera oscura, tapicería de muebles a lino carbón;
diseño e iluminación sin cambios; texturas PBR realistas
Ejemplo de API: Edición de Imágenes
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Replace the background with a tropical beach at sunset, match light direction, soft shadows",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
Generación Secuencial (V4 Sequential)
La variante secuencial genera múltiples imágenes en una sola llamada con estilo, identidad y paleta consistentes en todo el conjunto. Debes especificar el número de imágenes tanto en la indicación como en el parámetro max_images.
Hoja de Diseño de Personaje
Generar 6 hojas de personaje de un hacker cyberpunk.
Imagen 1: pose neutral; Imagen 2: pose de acción; Imagen 3: perfil lateral;
Imagen 4: vista trasera; Imagen 5: expresión feliz; Imagen 6: expresión seria.
Mismo atuendo y paleta, estilo de rotación limpio.
Campaña Publicitaria
Generar 4 conceptos de póster de la misma campaña de marca de café.
Imagen 1: titular "WAKE UP", luz matutina;
Imagen 2: titular "FUEL UP", energía de tarde;
Imagen 3: titular "WIND DOWN", calidez vespertina;
Imagen 4: titular "DREAM ON", ambiente nocturno.
Mantener color de marca marrón/dorado, cuadrícula y márgenes consistentes, iluminación cinematográfica.
Ejemplo de API: Generación Secuencial
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Generate 4 images of a sneaker in different colorways. Image 1: white/blue; Image 2: black/gold; Image 3: red/white; Image 4: green/cream. Studio lighting, identical angle and composition, clean background.",
"max_images": 4,
},
)
for url in output["outputs"]:
print(url)
Nota sobre costos: El modelo secuencial cobra por
max_images, no por la salida real. Si establecesmax_images=4pero solo describes 2 imágenes en tu indicación, se te cobrará por 4 de todas formas. Siempre coincide el número en tu indicación conmax_images.
Seedream 4.5: Tipografía y Edición Profunda
Seedream 4.5 se basa en la versión 4.0 con mejoras significativas en renderizado de texto, adherencia a indicaciones, calidad estética y consistencia con imágenes de referencia. Es la opción recomendada para cualquier trabajo que involucre tipografía, visuales de marca o edición de retratos.
Mejoras Clave Sobre la Versión 4.0
- Tipografía mejorada: Texto nítido y legible para pósters, logotipos, UI y diseños de marketing
- Composición a nivel de diseñador: Maneja diseños complejos estilo póster con jerarquía clara
- Mayor adherencia a indicaciones: Sigue de cerca las descripciones detalladas de sujetos, diseño y estilo
- Mayor resolución: Admite desde 2560x1440 hasta 4096x4096 (mínimo más alto que V4)
- Mejor consistencia de referencia: Preserva rasgos faciales, iluminación y tono de color de las imágenes de referencia
Variantes del Modelo
Al igual que V4, Seedream 4.5 ofrece cuatro variantes en WaveSpeedAI:
| Variante | Ruta del Modelo | Tipo | Caso de Uso |
|---|---|---|---|
| Base | bytedance/seedream-v4.5 | Texto a Imagen | Pósters con mucha tipografía, visuales de marca |
| Edit | bytedance/seedream-v4.5/edit | Imagen a Imagen | Edición de retratos, retoque de productos |
| Sequential | bytedance/seedream-v4.5/sequential | Lote T2I | Series consistentes, conjuntos de campaña |
| Edit-Sequential | bytedance/seedream-v4.5/edit-sequential | Lote I2I | Fusión de múltiples imágenes, transferencias de estilo |
Resoluciones Recomendadas (V4.5)
| Relación de Aspecto | Resolución Sugerida |
|---|---|
| 1:1 | 2048x2048 |
| 4:3 | 2688x2016 |
| 3:2 | 2688x1792 |
| 16:9 | 2560x1440 |
| Cuadrado 4K | 4096x4096 |
Mejores Prácticas para Renderizado de Texto
La característica destacada de Seedream 4.5 es la generación precisa de texto dentro de las imágenes. Sigue estas pautas para obtener mejores resultados:
- Usa comillas dobles alrededor del texto que debe aparecer en la imagen:
Generar un póster con el título "Seedream 4.5" - Especifica las características de la fuente: “sans-serif en negrita”, “script elegante”, “manuscrito”
- Describe la ubicación del texto: “título arriba al centro”, “subtítulo debajo”, “CTA abajo a la derecha”
- Mantén el texto corto: Las palabras de 1 a 10 funcionan mejor; los párrafos largos pueden tener inconsistencias
- Usa resoluciones más altas: 2048x2048 o superior proporciona tipografía notablemente más limpia
Ejemplo: Póster de Marca
Póster minimalista de conferencia tecnológica, fondo azul marino oscuro.
Título grande en blanco en mayúsculas en la parte superior: "AI SUMMIT 2026".
Subtítulo gris pequeño debajo: "San Francisco • June 15-17".
Forma geométrica holográfica abstracta centrada.
Acento de color de marca #3CA2F6. Diseño de cuadrícula limpio, espacio en blanco generoso.
Ejemplo de API: Generación con Mucha Tipografía
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4.5",
{
"prompt": "Coffee shop menu board, chalkboard style, title 'DAILY SPECIALS' in bold chalk lettering, items: Espresso $3, Latte $4, Cappuccino $4.50, warm ambient lighting, cozy cafe atmosphere",
"size": "2048x2048",
},
)
print(output["outputs"][0])
Generación Basada en Referencia (V4.5 Edit)
Seedream 4.5 Edit destaca en extraer y preservar características visuales de imágenes de referencia:
Transferencia de Gradación de Color
Cambiar el tono de color de la Imagen 1 para que coincida con el tono de color de la Imagen 2
Transferencia de Maquillaje
Transferir el maquillaje de la Imagen 2 a la persona en la Imagen 1
Aplicación de Estilo de Marca
Aplicar el estilo de diseño de marca de la Imagen 1 al producto en la Imagen 2,
crear una imagen promocional de serie de marca similar,
incluir todos los módulos de diseño de la Imagen 1
Seedream 5.0-Preview: Inteligencia y Razonamiento
Seedream 5.0-Preview introduce capacidades que van más allá de la generación de imágenes tradicional. Prioriza el conocimiento y la inteligencia sobre la estética pura, añadiendo búsqueda web en tiempo real, control de edición preciso y razonamiento lógico avanzado.
Nota: Para belleza visual pura y fotorrealismo, Seedream 4.5 sigue siendo la opción recomendada. El lanzamiento completo de la versión 5.0 combinará tanto inteligencia como estética.
Búsqueda Web en Tiempo Real
5.0-Preview es el primer modelo de generación de imágenes en admitir generación basada en búsqueda. El modelo determina de forma inteligente cuándo buscar según tu indicación:
- Términos sensibles al tiempo: Lanzamientos de productos recientes, eventos actuales
- Entidades específicas: Celebridades, marcas, ubicaciones
- Consultas de cola larga: Temas especializados que requieren precisión factual
Indicaciones de ejemplo que activan la búsqueda:
Generar concepto de diseño del iPhone 17 Pro Max
Hacer referencia a la interfaz de la aplicación Duolingo, diseñar una
página de tarjetas de vocabulario con contador de palabras y rachas, incorporar
la mascota del búho verde
Generar un póster de los Juegos Olímpicos de Invierno Nórdico: fondo de aurora noruega,
esquiador en uniforme nacional, incluir elementos olímpicos y mascota
Razonamiento Lógico Inteligente
5.0-Preview maneja operaciones complejas que requieren comprensión del contexto y toma de decisiones en múltiples pasos:
Clasificación y Distribución
Clasificar las flores en la Imagen 1 por variedad, organizarlas
por separado en los tres jarrones mostrados en la Imagen 2
Comprensión del Mundo Físico
Dos reglas de papelería, la de arriba es una regla de plástico de 20cm,
la de abajo es una regla de acero de 10cm
Razonamiento 3D
Generar la forma ensamblada en 3D basada en el diagrama
de diseño plano del empaque
Conocimiento Específico de Dominio
Hacer referencia a este conjunto de dibujos CAD, generar una visualización
realista del edificio
Diagrama de vista anterior del sistema respiratorio humano que muestra:
cavidad nasal, fosas nasales, cavidad oral, faringe, laringe,
tráquea, bronquios principales izquierdo y derecho, pulmones
izquierdo y derecho, y diafragma
Edición Basada en Ejemplos
En lugar de describir transformaciones complejas, muestra al modelo lo que deseas con ejemplos de antes/después:
Hacer referencia al cambio de la Imagen 1 a la Imagen 2, aplicar la
misma operación a la Imagen 3
Esto funciona para cambios de peinado, intercambios de escenas, transformaciones de materiales y cambios de perspectiva.
Guía de Ingeniería de Indicaciones
Estos consejos se aplican a todas las versiones de Seedream 4.0–5.0.
Usa Lenguaje Natural, No Listas de Etiquetas
Escribe narrativas coherentes en lugar de listas de palabras clave fragmentadas:
Evitar:
chica, vestido lujoso, sombrilla, camino arbolado, pintura al óleo, estilo Monet
Preferir:
Una chica con un vestido lujoso caminando bajo una sombrilla por un camino arbolado,
al estilo de una pintura al óleo de Monet
Fórmula de Estructura de Indicación
[Sujeto] + [Acción/Pose] + [Entorno/Escenario] + [Estilo] + [Detalles Técnicos] + [Contenido de Texto]
Ejemplo:
Un barista profesional (sujeto) creando arte latte (acción) en una moderna
cafetería especializada (entorno), estilo fotorrealista (estilo),
luz cálida de la mañana a través de grandes ventanas, poca profundidad de campo (técnico),
una pizarra detrás de ellos que dice "ARTISAN ROASTERS" (contenido de texto)
Indicaciones de Edición
Para la edición de imágenes, usa instrucciones específicas e inequívocas que indiquen explícitamente qué cambia y qué permanece igual:
Evitar: Hazlo ver mejor
Preferir: Reemplazar el cielo nublado con un fondo de atardecer vívido, tonos naranja cálidos; mantener el edificio y el primer plano sin cambios
Marcado Visual para Ediciones Complejas
Cuando las descripciones de texto solas no son suficientes para un posicionamiento preciso, usa flechas, cuadros delimitadores o garabatos en la imagen de referencia para designar regiones específicas para modificación.
Errores Comunes
- Instrucciones conflictivas: “Personaje de dibujos animados fotorrealista” — elige una dirección de estilo
- Complicar demasiado las indicaciones: Comienza simple, agrega detalles de forma incremental
- Ignorar la relación de aspecto: Adapta las dimensiones a tu caso de uso (cuadrado para redes sociales, horizontal para banners)
- Instrucciones de edición vagas: Evita pronombres como “cámbialo” — especifica qué es “eso”
Elegir la Versión Correcta
Guía de Decisión Rápida
- ¿Necesitas velocidad y bajo costo? → Seedream 4.0
- ¿Necesitas texto nítido en las imágenes? → Seedream 4.5
- ¿Necesitas pósters de calidad de marca? → Seedream 4.5
- ¿Necesitas conjuntos de múltiples imágenes consistentes? → V4 o V4.5 Sequential
- ¿Necesitas editar fotos existentes? → V4 o V4.5 Edit
- ¿Necesitas imágenes de eventos actuales? → Seedream 5.0-Preview
- ¿Necesitas contenido basado en conocimiento? → Seedream 5.0-Preview
Comparación Detallada
| Capacidad | 4.0 | 4.5 | 5.0-Preview |
|---|---|---|---|
| Texto a Imagen | Sí | Sí | Sí |
| Edición de Imagen | Sí | Sí (mejor) | Sí |
| Múltiples Imágenes | Sí | Sí | Sí |
| Generación Secuencial | Sí | Sí | Sí |
| Renderizado de Texto | Bueno | Excelente | Bueno |
| Búsqueda Web | No | No | Sí |
| Razonamiento Lógico | Básico | Básico | Avanzado |
| Resolución Máxima | 4096x4096 | 4096x4096 | 4K |
| Resolución Mínima | ~320x320 | 2560x1440 | — |
| Velocidad | Más rápida | Moderada | Moderada |
| Costo | $0.027 | $0.04 | — |
Limitaciones de Versión
Seedream 4.0: El texto pequeño puede repetirse o degradarse; la precisión de edición es menor que la versión 4.5.
Seedream 4.5: Ocasionales problemas de desenfoque o recorte; mayor costo y tiempo de generación que la versión 4.0.
Seedream 5.0-Preview: Cierta apariencia generada por IA; ocasionales problemas de proporción; inestabilidad en la estructura del texto; razonamiento limitado de gráficos/datos. Actualmente prioriza la inteligencia sobre la estética.
Todos los Modelos Disponibles en WaveSpeedAI
| Modelo | Tipo | Precio | Mejor Para |
|---|---|---|---|
bytedance/seedream-v4 | Texto a Imagen | $0.027 | Pósters, diseños en cuadrícula, diseños conceptuales |
bytedance/seedream-v4/edit | Imagen a Imagen | $0.027 | Cambios de atuendo, cambios de fondo, retoque |
bytedance/seedream-v4/sequential | Lote T2I | $0.027/imagen | Hojas de personajes, conjuntos de campaña |
bytedance/seedream-v4/edit-sequential | Lote I2I | $0.027/imagen | Fusión de múltiples imágenes, variantes A/B |
bytedance/seedream-v4.5 | Texto a Imagen | $0.04 | Tipografía, visuales de marca, pósters 4K |
bytedance/seedream-v4.5/edit | Imagen a Imagen | $0.04 | Edición de retratos, transferencia de estilo/características |
bytedance/seedream-v4.5/sequential | Lote T2I | $0.04/imagen | Series de marca, campañas consistentes |
bytedance/seedream-v4.5/edit-sequential | Lote I2I | $0.04/imagen | Edición de múltiples imágenes, exploración de diseño |
bytedance/seedream-v5.0-lite | Texto a Imagen | $0.035 | Generación basada en conocimiento, búsqueda web |
bytedance/seedream-v5.0-lite/edit | Imagen a Imagen | $0.035 | Edición inteligente, transferencia de características |
bytedance/seedream-v5.0-lite/sequential | Lote T2I | $0.035/imagen | Series inteligentes consistentes |
bytedance/seedream-v5.0-lite/edit-sequential | Lote I2I | $0.035/imagen | Edición inteligente de múltiples imágenes |
Primeros Pasos
- Regístrate en WaveSpeedAI y obtén tu clave de API
- Instala el SDK:
pip install wavespeed - Elige tu modelo basándote en la guía de decisión anterior
- Escribe tu indicación usando la fórmula de estructura y las mejores prácticas
- Genera e itera: Refina las indicaciones según los resultados
import wavespeed
# Texto a Imagen con Seedream 4.5
output = wavespeed.run(
"bytedance/seedream-v4.5",
{"prompt": "A sleek product showcase poster, title 'NEXT GEN' in bold white sans-serif, dark gradient background, floating smartphone with holographic screen, cinematic lighting, brand color #3CA2F6"},
)
print(output["outputs"][0])
import wavespeed
# Edición de Imagen con Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Change the outfit to a formal black suit, keep the same pose and background lighting",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
import wavespeed
# Generación Secuencial con Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Generate 3 step-by-step tutorial visuals for making pour-over coffee. Image 1: grinding beans; Image 2: pouring water in circular motion; Image 3: finished cup with steam. Uniform warm style, numbered labels.",
"max_images": 3,
},
)
for url in output["outputs"]:
print(url)
Ya sea que estés construyendo automatización de marketing, creando contenido para redes sociales a escala o desarrollando aplicaciones creativas, la familia Seedream 4.0–5.0 en WaveSpeedAI proporciona el espectro completo desde la iteración rápida hasta la generación inteligente basada en conocimiento.





