Seedream 4.0 bis 5.0 Komplettes Tutorial: Text-zu-Bild, Bearbeitung und Multi-Bild-Generierung
Meistern Sie ByteDances Seedream-Modellfamilie von 4.0 bis 5.0. Lernen Sie Text-zu-Bild-Generierung, Bildbearbeitung, sequenzielle Multi-Bild-Erstellung, Prompt-Engineering und wie Sie die richtige Version für Ihren Workflow wählen.
ByteDances Seedream-Familie hat sich rasant von Version 4.0 auf 5.0 entwickelt, wobei jedes Release neue Funktionen für Bildgenerierung, Bearbeitung und intelligentes Reasoning mitbringt. Dieses Tutorial deckt die gesamte Bandbreite von 4.0 bis 5.0 ab – was jede Version am besten kann, welche Modellvarianten zu verwenden sind und wie man über die WaveSpeedAI-API produktionsreife Ergebnisse erzielt.
Überblick über die Modellfamilie
Das Seedream-4.0–5.0-Lineup unterstützt drei Arten von Eingaben – Text, ein einzelnes Bild und mehrere Bilder – und ermöglicht damit Text-zu-Bild-Generierung, Bildbearbeitung, Multi-Bild-Fusion sowie sequenzielle Batch-Generierung mit thematischer Konsistenz.
Jede Hauptversion hat unterschiedliche Stärken:
| Version | Positionierung | Ideal für | Preis (WaveSpeedAI) |
|---|---|---|---|
| 4.0 | Hohe Effizienz | Schnelle Iteration, layout-bewusste Poster, Grid-Designs, kostensensitive Produktion | $0,027/Bild |
| 4.5 | Tiefgreifende Bearbeitung & Typografie | Porträts, Markenvisuals, scharfes Text-Rendering, 4K-Poster-Komposition | $0,04/Bild |
| 5.0-Lite | Schlankes 5.0 | Schnelle 5.0-Generierung und -Bearbeitung, zugänglicher Einstiegspunkt | Jetzt verfügbar |
| 5.0-Preview | Wissen & Reasoning | Aktuelle Themen, Web-Suche, logisches Schlussfolgern, domänenspezifische Inhalte | Demnächst verfügbar |
Seedream 4.0: Layout-bewusste Generierung
Seedream 4.0 ist optimiert für mehrteilige Poster, Konzeptdesigns mit Text, Serien-Key-Visuals (KV) und Social-Media-Assets. Es glänzt bei rasterbasierenden Layouts, der Planung von Leerraum für Titel und Untertitel sowie der Verbesserung der Textlesbarkeit.
Technische Daten
- Standardausgabe: 2048x2048 (2K)
- Maximale Auflösung: 4096x4096
- Inferenzgeschwindigkeit: ~1,8 s für ein 2K-Bild
- Seitenverhältnisse: 1:1, 3:2, 4:3, 16:9, 21:9 und benutzerdefiniert
Modellvarianten
Seedream 4.0 ist auf WaveSpeedAI in vier Varianten verfügbar, die jeweils für einen anderen Workflow konzipiert sind:
bytedance/seedream-v4 — Text-zu-Bild. Generiert Bilder aus Textprompts. Ideal für Poster, Konzeptkunst und Social-Media-Grafiken.
bytedance/seedream-v4/edit — Bild-zu-Bild. Modifiziert vorhandene Bilder: Outfit-Wechsel, Hintergrundersatz, Materialänderungen, Innenraumumgestaltung. Unterstützt bis zu 10 Referenzbilder.
bytedance/seedream-v4/sequential — Batch-Text-zu-Bild. Generiert mehrere Bilder gleichzeitig mit bildübergreifender Konsistenz. Perfekt für Charakterbögen, Werbekampagnen und Schritt-für-Schritt-Diagramme.
bytedance/seedream-v4/edit-sequential — Batch-Bild-zu-Bild. Multi-Bild-Eingabe mit Batch-Ausgabe. Ermöglicht Multi-Bild-Fusion, Stilübertragungen über Sets hinweg und A/B-Variantenvergleiche.
Text-zu-Bild-Prompting (V4)
Beim Prompting für Seedream 4.0 sollte man das Motiv, das Layout (Raster, Triptychon usw.), die Textplatzierung (Titel, Untertitel, CTA) und den bevorzugten Stil angeben.
2x2-Raster-Poster
2x2 grid poster layout, clean margins for typography, title at top center:
"SUMMER COLLECTION", subtitle: "New Arrivals 2026". Panel 1: beachside resort;
Panel 2: sunset cocktail; Panel 3: tropical flowers; Panel 4: ocean waves.
Consistent color grading, cinematic lighting, brand color #3CA2F6,
high legibility background, minimal clutter
Triptychon
Horizontal triptych panels, left-to-right narrative: mountain sunrise ->
hiking trail -> summit celebration, unified palette warm earth tones,
soft vignette, clear gutters, strong typographic hierarchy,
space reserved for CTA "START YOUR ADVENTURE"
Minimalistisches Poster
Minimal poster, large title center: "INNOVATION SUMMIT", small subtitle
below: "March 2026 • San Francisco", single focal object: abstract
geometric sculpture, monochrome + accent #3CA2F6, high legibility
background, grid-based layout
Comic-Strip
4-panel comic strip layout, speech bubble placeholders.
Panel 1: developer stares at screen; Panel 2: AI generates solution;
Panel 3: developer celebrates; Panel 4: "It was that easy?"
Bold line art, flat shading, clear gutters, high readability
API-Beispiel: Text-zu-Bild
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4",
{"prompt": "2x2 grid poster, title: 'TECH EXPO 2026', four futuristic product concepts, clean margins, cinematic lighting, brand color blue"},
)
print(output["outputs"][0])
Bildbearbeitung (V4 Edit)
Die Edit-Variante modifiziert vorhandene Bilder und bewahrt dabei Identität des Motivs, Beleuchtung und Komposition. Klare, strukturierte Prompts nach dem Muster Aktion + Objekt + Zieleigenschaft + Einschränkungen erzielen die besten Ergebnisse.
Outfit-Wechsel
Outfit swap for portrait, replace clothing with elegant navy blazer;
keep pose and composition; accessories: gold watch;
makeup/hair unchanged; preserve skin tone and lighting;
clean edges, no artifacts
Hintergrundersatz
Background replacement for subject, keep subject edges;
new environment: modern office with floor-to-ceiling windows;
match light direction and color temperature;
soft contact shadows; no haloing
Innenraumumgestaltung
Interior finish swap, update wall to exposed brick,
floor to dark hardwood, furniture upholstery to charcoal linen;
layout and lighting unchanged; realistic PBR textures
API-Beispiel: Bildbearbeitung
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Replace the background with a tropical beach at sunset, match light direction, soft shadows",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
Sequenzielle Generierung (V4 Sequential)
Die Sequential-Variante generiert mehrere Bilder in einem einzigen Aufruf mit konsistentem Stil, Identität und Farbpalette über das gesamte Set. Die Anzahl der Bilder muss sowohl im Prompt als auch im Parameter max_images angegeben werden.
Charakter-Design-Bogen
Generate 6 character sheets of a cyberpunk hacker.
Image 1: neutral pose; Image 2: action pose; Image 3: side profile;
Image 4: back view; Image 5: happy expression; Image 6: serious expression.
Same outfit and palette, clean turnaround style.
Werbekampagne
Generate 4 poster concepts of the same coffee brand campaign.
Image 1: headline "WAKE UP", morning light;
Image 2: headline "FUEL UP", afternoon energy;
Image 3: headline "WIND DOWN", evening warmth;
Image 4: headline "DREAM ON", night ambiance.
Keep brand color brown/gold, consistent grid and margins, cinematic lighting.
API-Beispiel: Sequenzielle Generierung
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Generate 4 images of a sneaker in different colorways. Image 1: white/blue; Image 2: black/gold; Image 3: red/white; Image 4: green/cream. Studio lighting, identical angle and composition, clean background.",
"max_images": 4,
},
)
for url in output["outputs"]:
print(url)
Kostenhinweis: Das Sequential-Modell berechnet Kosten nach
max_images, nicht nach der tatsächlichen Ausgabe. Wennmax_images=4gesetzt, aber nur 2 Bilder im Prompt beschrieben werden, werden trotzdem 4 Bilder berechnet. Die Anzahl im Prompt sollte immer mitmax_imagesübereinstimmen.
Seedream 4.5: Typografie und tiefgreifende Bearbeitung
Seedream 4.5 baut auf 4.0 auf und bietet erhebliche Verbesserungen beim Text-Rendering, der Prompt-Treue, der ästhetischen Qualität und der Konsistenz von Referenzbildern. Es ist die empfohlene Wahl für alle Arbeiten, die Typografie, Markenvisuals oder Porträtbearbeitung beinhalten.
Wesentliche Verbesserungen gegenüber 4.0
- Verbesserte Typografie: Scharfer, gut lesbarer Text für Poster, Logos, UI und Marketing-Layouts
- Komposition auf Designer-Niveau: Verarbeitet komplexe Poster-artige Layouts mit klarer Hierarchie
- Stärkere Prompt-Treue: Folgt detaillierten Beschreibungen von Motiven, Layout und Stil präzise
- Höhere Auflösung: Unterstützt 2560x1440 bis 4096x4096 (höhere Mindestauflösung als V4)
- Bessere Referenzkonsistenz: Bewahrt Gesichtszüge, Beleuchtung und Farbton aus Referenzbildern
Modellvarianten
Wie V4 bietet Seedream 4.5 vier Varianten auf WaveSpeedAI:
| Variante | Modellpfad | Typ | Anwendungsfall |
|---|---|---|---|
| Base | bytedance/seedream-v4.5 | Text-zu-Bild | Typografie-lastige Poster, Markenvisuals |
| Edit | bytedance/seedream-v4.5/edit | Bild-zu-Bild | Porträtbearbeitung, Produkt-Retusche |
| Sequential | bytedance/seedream-v4.5/sequential | Batch T2I | Konsistente Serien, Kampagnen-Sets |
| Edit-Sequential | bytedance/seedream-v4.5/edit-sequential | Batch I2I | Multi-Bild-Fusion, Stilübertragungen |
Empfohlene Auflösungen (V4.5)
| Seitenverhältnis | Empfohlene Auflösung |
|---|---|
| 1:1 | 2048x2048 |
| 4:3 | 2688x2016 |
| 3:2 | 2688x1792 |
| 16:9 | 2560x1440 |
| Quadratisch 4K | 4096x4096 |
Best Practices für Text-Rendering
Seedreams 4.5 herausragendes Merkmal ist die präzise Textgenerierung innerhalb von Bildern. Für beste Ergebnisse gelten folgende Richtlinien:
- Doppelte Anführungszeichen um Text verwenden, der im Bild erscheinen soll:
Generate a poster with the title "Seedream 4.5" - Schriftmerkmale angeben: „fettes Sans-Serif”, „elegante Schreibschrift”, „handgeschrieben”
- Textplatzierung beschreiben: „Titel oben-mittig”, „Untertitel darunter”, „CTA unten-rechts”
- Text kurz halten: 1–10 Wörter funktionieren am besten; lange Absätze können Inkonsistenzen aufweisen
- Höhere Auflösungen nutzen: 2048x2048 oder höher liefert merklich sauberere Typografie
Beispiel: Marken-Poster
Minimalist tech conference poster, dark navy background.
Large white all-caps title at the top: "AI SUMMIT 2026".
Small gray subtitle below: "San Francisco • June 15-17".
Abstract holographic geometric shape centered.
Brand color accent #3CA2F6. Clean grid layout, generous whitespace.
API-Beispiel: Typografie-lastige Generierung
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4.5",
{
"prompt": "Coffee shop menu board, chalkboard style, title 'DAILY SPECIALS' in bold chalk lettering, items: Espresso $3, Latte $4, Cappuccino $4.50, warm ambient lighting, cozy cafe atmosphere",
"size": "2048x2048",
},
)
print(output["outputs"][0])
Referenzbasierte Generierung (V4.5 Edit)
Seedream 4.5 Edit zeichnet sich durch die Extraktion und Beibehaltung visueller Eigenschaften aus Referenzbildern aus:
Farbton-Übertragung
Change Image 1's color tone to match Image 2's color tone
Make-up-Übertragung
Transfer the makeup from Image 2 onto the person in Image 1
Marken-Stil-Anwendung
Apply Image 1's brand design style to the product in Image 2,
create a similar brand series promotional image,
include all design modules from Image 1
Seedream 5.0-Preview: Intelligenz und Reasoning
Seedream 5.0-Preview führt Fähigkeiten ein, die über die traditionelle Bildgenerierung hinausgehen. Es priorisiert Wissen und Intelligenz gegenüber reiner Ästhetik und fügt Echtzeit-Web-Suche, präzise Bearbeitungskontrolle und fortgeschrittenes logisches Schlussfolgern hinzu.
Hinweis: Für reine visuelle Schönheit und Fotorealismus bleibt Seedream 4.5 die empfohlene Wahl. Das vollständige 5.0-Release wird sowohl Intelligenz als auch Ästhetik vereinen.
Echtzeit-Web-Suche
5.0-Preview ist das erste Bildgenerierungsmodell, das suchbasierte Generierung unterstützt. Das Modell bestimmt anhand des Prompts intelligent, wann eine Suche durchgeführt werden soll:
- Zeitkritische Begriffe: Aktuelle Produktveröffentlichungen, aktuelle Ereignisse
- Spezifische Entitäten: Prominente, Marken, Orte
- Long-Tail-Anfragen: Nischenthemen, die faktische Genauigkeit erfordern
Beispiel-Prompts, die eine Suche auslösen:
Generate iPhone 17 Pro Max concept design
Reference the Duolingo app interface, design a vocabulary
flashcard page with word and streak counter, incorporate
the green owl mascot
Generate a Nordic Winter Olympics poster: Norwegian aurora
background, skier in national uniform, include Olympic
elements and mascot
Intelligentes logisches Schlussfolgern
5.0-Preview bewältigt komplexe Operationen, die Kontextverständnis und mehrstufige Entscheidungsfindung erfordern:
Klassifizierung und Verteilung
Classify the flowers in Image 1 by variety, arrange them
separately in the three vases shown in Image 2
Verständnis der physischen Welt
Two stationery rulers, top is a 20cm plastic ruler,
bottom is a 10cm steel ruler
3D-Reasoning
Generate the 3D assembled form based on the packaging
flat layout diagram
Domänenspezifisches Wissen
Reference this set of CAD drawings, generate a realistic
building visualization
Human respiratory system anterior view diagram showing:
nasal cavity, nostrils, oral cavity, pharynx, larynx,
trachea, left and right main bronchi, left and right
lungs, and diaphragm
Beispielbasierte Bearbeitung
Anstatt komplexe Transformationen zu beschreiben, zeigt man dem Modell mit Vorher-/Nachher-Beispielen, was man möchte:
Reference the change from Image 1 to Image 2, apply the
same operation to Image 3
Dies funktioniert für Frisurenwechsel, Szenenwechsel, Materialtransformationen und Perspektivwechsel.
Leitfaden für Prompt-Engineering
Diese Tipps gelten für alle Seedream-Versionen von 4.0 bis 5.0.
Natürliche Sprache verwenden, keine Tag-Listen
Kohärente Beschreibungen statt fragmentierter Schlüsselwortlisten schreiben:
Vermeiden:
girl, lavish dress, parasol, tree-lined path, oil painting, Monet style
Bevorzugen:
A girl in a lavish dress walking under a parasol along a tree-lined path,
in the style of a Monet oil painting
Prompt-Strukturformel
[Motiv] + [Aktion/Pose] + [Umgebung/Setting] + [Stil] + [Technische Details] + [Textinhalt]
Beispiel:
A professional barista (subject) crafting latte art (action) in a modern
specialty coffee shop (environment), photorealistic style (style),
warm morning light through large windows, shallow depth of field (technical),
a chalkboard behind them reading "ARTISAN ROASTERS" (text content)
Bearbeitungs-Prompts
Für die Bildbearbeitung spezifische, eindeutige Anweisungen verwenden, die explizit angeben, was sich ändert und was gleich bleibt:
Vermeiden: Make it look better
Bevorzugen: Replace the overcast sky with a vivid sunset backdrop, warm orange tones; keep the building and foreground unchanged
Visuelle Markierungen für komplexe Bearbeitungen
Wenn Textbeschreibungen allein für eine präzise Positionierung nicht ausreichen, Pfeile, Begrenzungsrahmen oder Skizzen auf dem Referenzbild verwenden, um bestimmte Bereiche für die Änderung zu kennzeichnen.
Häufige Fehler
- Widersprüchliche Anweisungen: „Photorealistic cartoon character” — eine Stilrichtung wählen
- Überkomplizierte Prompts: Einfach anfangen, Details schrittweise hinzufügen
- Seitenverhältnis ignorieren: Abmessungen dem Verwendungszweck anpassen (quadratisch für Social Media, Querformat für Banner)
- Vage Bearbeitungsanweisungen: Pronomen wie „change it” vermeiden — angeben, was „es” ist
Die richtige Version wählen
Schnell-Entscheidungsführer
- Geschwindigkeit und niedrige Kosten benötigt? → Seedream 4.0
- Scharfen Text in Bildern benötigt? → Seedream 4.5
- Poster in Markenqualität benötigt? → Seedream 4.5
- Konsistente Multi-Bild-Sets benötigt? → V4 oder V4.5 Sequential
- Vorhandene Fotos bearbeiten? → V4 oder V4.5 Edit
- Bilder zu aktuellen Ereignissen benötigt? → Seedream 5.0-Preview
- Wissensgetriebene Inhalte benötigt? → Seedream 5.0-Preview
Detaillierter Vergleich
| Fähigkeit | 4.0 | 4.5 | 5.0-Preview |
|---|---|---|---|
| Text-zu-Bild | Ja | Ja | Ja |
| Bildbearbeitung | Ja | Ja (besser) | Ja |
| Multi-Bild | Ja | Ja | Ja |
| Sequenzielle Generierung | Ja | Ja | Ja |
| Text-Rendering | Gut | Hervorragend | Gut |
| Web-Suche | Nein | Nein | Ja |
| Logisches Schlussfolgern | Grundlegend | Grundlegend | Fortgeschritten |
| Max. Auflösung | 4096x4096 | 4096x4096 | 4K |
| Min. Auflösung | ~320x320 | 2560x1440 | — |
| Geschwindigkeit | Am schnellsten | Moderat | Moderat |
| Kosten | $0,027 | $0,04 | — |
Einschränkungen der Versionen
Seedream 4.0: Kleiner Text kann sich wiederholen oder verschlechtern; Bearbeitungsgenauigkeit geringer als bei 4.5.
Seedream 4.5: Gelegentliche Unschärfe- oder Beschneidungsprobleme; höhere Kosten und Generierungszeit als 4.0.
Seedream 5.0-Preview: Teilweise KI-generiertes Erscheinungsbild; gelegentliche Proportionsprobleme; Instabilität bei Textstrukturen; eingeschränktes Diagramm-/Daten-Reasoning. Priorisiert derzeit Intelligenz über Ästhetik.
Alle verfügbaren Modelle auf WaveSpeedAI
| Modell | Typ | Preis | Ideal für |
|---|---|---|---|
bytedance/seedream-v4 | Text-zu-Bild | $0,027 | Poster, Grid-Layouts, Konzeptdesigns |
bytedance/seedream-v4/edit | Bild-zu-Bild | $0,027 | Outfit-Wechsel, Hintergrundänderungen, Retusche |
bytedance/seedream-v4/sequential | Batch T2I | $0,027/Bild | Charakterbögen, Kampagnen-Sets |
bytedance/seedream-v4/edit-sequential | Batch I2I | $0,027/Bild | Multi-Bild-Fusion, A/B-Varianten |
bytedance/seedream-v4.5 | Text-zu-Bild | $0,04 | Typografie, Markenvisuals, 4K-Poster |
bytedance/seedream-v4.5/edit | Bild-zu-Bild | $0,04 | Porträtbearbeitung, Stil-/Merkmalübertragung |
bytedance/seedream-v4.5/sequential | Batch T2I | $0,04/Bild | Marken-Serien, konsistente Kampagnen |
bytedance/seedream-v4.5/edit-sequential | Batch I2I | $0,04/Bild | Multi-Bild-Bearbeitung, Design-Exploration |
bytedance/seedream-v5.0-lite | Text-zu-Bild | $0,035 | Wissensgetriebene Generierung, Web-Suche |
bytedance/seedream-v5.0-lite/edit | Bild-zu-Bild | $0,035 | Intelligente Bearbeitung, Merkmalübertragung |
bytedance/seedream-v5.0-lite/sequential | Batch T2I | $0,035/Bild | Konsistente intelligente Serien |
bytedance/seedream-v5.0-lite/edit-sequential | Batch I2I | $0,035/Bild | Multi-Bild-intelligente Bearbeitung |
Erste Schritte
- Registrieren auf WaveSpeedAI und API-Schlüssel erhalten
- SDK installieren:
pip install wavespeed - Modell auswählen anhand des obigen Entscheidungsführers
- Prompt schreiben unter Verwendung der Strukturformel und Best Practices
- Generieren und iterieren: Prompts anhand der Ergebnisse verfeinern
import wavespeed
# Text-zu-Bild mit Seedream 4.5
output = wavespeed.run(
"bytedance/seedream-v4.5",
{"prompt": "A sleek product showcase poster, title 'NEXT GEN' in bold white sans-serif, dark gradient background, floating smartphone with holographic screen, cinematic lighting, brand color #3CA2F6"},
)
print(output["outputs"][0])
import wavespeed
# Bildbearbeitung mit Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Change the outfit to a formal black suit, keep the same pose and background lighting",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
import wavespeed
# Sequenzielle Generierung mit Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Generate 3 step-by-step tutorial visuals for making pour-over coffee. Image 1: grinding beans; Image 2: pouring water in circular motion; Image 3: finished cup with steam. Uniform warm style, numbered labels.",
"max_images": 3,
},
)
for url in output["outputs"]:
print(url)
Egal ob Marketing-Automatisierung aufgebaut, Social-Media-Inhalte in großem Maßstab erstellt oder kreative Anwendungen entwickelt werden – die Seedream-4.0–5.0-Familie auf WaveSpeedAI bietet das gesamte Spektrum von schneller Iteration bis hin zu intelligenter, wissensgetriebener Generierung.





