Tutoriel complet Seedream 4.0 à 5.0 : Génération d'images à partir de texte, édition et génération multi-images

Maîtrisez la famille de modèles Seedream de ByteDance, de la version 4.0 à 5.0. Apprenez la génération d'images à partir de texte, l'édition d'images, la création séquentielle de plusieurs images, l'ingénierie des prompts et comment choisir la bonne version pour votre flux de travail.

17 min read

La famille Seedream de ByteDance a évolué rapidement de la version 4.0 à la version 5.0, chaque version apportant de nouvelles fonctionnalités pour la génération d’images, l’édition et le raisonnement intelligent. Ce tutoriel couvre l’ensemble de la gamme 4.0–5.0 — ce que chaque version fait le mieux, quelles variantes de modèle utiliser, et comment obtenir des résultats de qualité production via l’API de WaveSpeedAI.


Aperçu de la famille de modèles

La gamme Seedream 4.0–5.0 prend en charge trois types d’entrées — texte, une seule image et plusieurs images — permettant la génération texte-vers-image, l’édition d’images, la fusion multi-images et la génération par lot séquentielle avec cohérence thématique.

Chaque version majeure possède des points forts distincts :

VersionPositionnementIdéal pourPrix (WaveSpeedAI)
4.0Haute efficacitéItération rapide, affiches avec mise en page, designs en grille, production sensible aux coûts0,027 $/image
4.5Édition approfondie et typographiePortraits, visuels de marque, rendu de texte net, composition d’affiche 4K0,04 $/image
5.0-LiteVersion 5.0 allégéeGénération et édition 5.0 rapides, point d’entrée accessibleDisponible maintenant
5.0-PreviewConnaissance et raisonnementSujets tendance, recherche web, raisonnement logique, contenu spécialiséBientôt disponible

Seedream 4.0 : Génération avec mise en page intelligente

Seedream 4.0 est optimisé pour les affiches multi-panneaux, les designs conceptuels avec texte, les visuels clés de série (KV) et les contenus pour réseaux sociaux. Il excelle dans les mises en page en grille, la planification des espaces blancs pour les titres et sous-titres, et l’amélioration de la lisibilité du texte.

Spécifications principales

  • Sortie par défaut : 2048x2048 (2K)
  • Résolution maximale : 4096x4096
  • Vitesse d’inférence : ~1,8 s pour une image 2K
  • Ratios d’aspect : 1:1, 3:2, 4:3, 16:9, 21:9 et personnalisé

Variantes de modèles

Seedream 4.0 est disponible en quatre variantes sur WaveSpeedAI, chacune conçue pour un flux de travail différent :

bytedance/seedream-v4 — Texte-vers-image. Génère des images à partir de prompts textuels. Idéal pour les affiches, l’art conceptuel et les visuels pour réseaux sociaux.

bytedance/seedream-v4/edit — Image-vers-image. Modifie des images existantes : changements de tenue, remplacement d’arrière-plan, changements de matériaux, redesigns d’intérieur. Prend en charge jusqu’à 10 images de référence.

bytedance/seedream-v4/sequential — Texte-vers-image par lot. Génère plusieurs images à la fois avec cohérence entre les images. Parfait pour les fiches personnages, les campagnes publicitaires et les diagrammes étape par étape.

bytedance/seedream-v4/edit-sequential — Image-vers-image par lot. Entrée multi-images avec sortie par lot. Permet la fusion multi-images, les transferts de style sur des ensembles et les comparaisons de variantes A/B.

Création de prompts texte-vers-image (V4)

Lors de la création de prompts pour Seedream 4.0, précisez le sujet, la mise en page (grille, triptyque, etc.), le placement du texte (titre, sous-titre, CTA) et le style préféré.

Affiche en grille 2x2

Mise en page d'affiche en grille 2x2, marges propres pour la typographie, titre centré en haut :
"SUMMER COLLECTION", sous-titre : "New Arrivals 2026". Panneau 1 : complexe balnéaire ;
Panneau 2 : cocktail au coucher du soleil ; Panneau 3 : fleurs tropicales ; Panneau 4 : vagues de l'océan.
Étalonnage des couleurs cohérent, éclairage cinématographique, couleur de marque #3CA2F6,
arrière-plan très lisible, encombrement minimal

Triptyque

Panneaux triptyque horizontaux, narration de gauche à droite : lever de soleil en montagne ->
sentier de randonnée -> célébration au sommet, palette unifiée tons chauds terreux,
vignettage doux, gouttières nettes, hiérarchie typographique forte,
espace réservé pour le CTA "START YOUR ADVENTURE"

Affiche minimaliste

Affiche minimaliste, grand titre centré : "INNOVATION SUMMIT", petit sous-titre
en dessous : "Mars 2026 • San Francisco", objet focal unique : sculpture
géométrique abstraite, monochrome + accent #3CA2F6, arrière-plan très lisible,
mise en page en grille

Bande dessinée

Mise en page en bande dessinée 4 cases, espaces réservés pour les bulles de dialogue.
Case 1 : développeur fixe l'écran ; Case 2 : l'IA génère une solution ;
Case 3 : le développeur célèbre ; Case 4 : "C'était aussi simple ?"
Trait gras, aplats de couleur, gouttières nettes, haute lisibilité

Exemple d’API : Texte-vers-image

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4",
    {"prompt": "Affiche en grille 2x2, titre : 'TECH EXPO 2026', quatre concepts de produits futuristes, marges propres, éclairage cinématographique, couleur de marque bleue"},
)

print(output["outputs"][0])

Édition d’images (V4 Edit)

La variante d’édition modifie les images existantes tout en préservant l’identité du sujet, l’éclairage et la composition. Utilisez des prompts clairs et structurés en suivant le schéma : action + objet + caractéristique cible + contraintes.

Changement de tenue

Changement de tenue pour portrait, remplacer les vêtements par une élégante veste marine ;
garder la pose et la composition ; accessoires : montre en or ;
maquillage/coiffure inchangés ; préserver le teint et l'éclairage ;
bords nets, sans artefacts

Remplacement d’arrière-plan

Remplacement d'arrière-plan pour le sujet, garder les bords du sujet ;
nouvel environnement : bureau moderne avec des baies vitrées du sol au plafond ;
correspondre la direction de la lumière et la température de couleur ;
douces ombres de contact ; pas d'auréole

Redesign d’intérieur

Changement de finition intérieure, mettre à jour le mur en brique apparente,
le sol en parquet sombre, le tissu d'ameublement en lin anthracite ;
disposition et éclairage inchangés ; textures PBR réalistes

Exemple d’API : Édition d’images

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Remplacer l'arrière-plan par une plage tropicale au coucher du soleil, correspondre la direction de la lumière, douces ombres",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])

Génération séquentielle (V4 Sequential)

La variante séquentielle génère plusieurs images en un seul appel avec un style, une identité et une palette cohérents sur l’ensemble. Vous devez spécifier le nombre d’images à la fois dans le prompt et dans le paramètre max_images.

Fiche de design de personnage

Générer 6 fiches de personnage d'un hacker cyberpunk.
Image 1 : pose neutre ; Image 2 : pose d'action ; Image 3 : profil latéral ;
Image 4 : vue de dos ; Image 5 : expression heureuse ; Image 6 : expression sérieuse.
Même tenue et palette, style de rotation net.

Campagne publicitaire

Générer 4 concepts d'affiche pour la même campagne d'une marque de café.
Image 1 : titre "WAKE UP", lumière matinale ;
Image 2 : titre "FUEL UP", énergie de l'après-midi ;
Image 3 : titre "WIND DOWN", chaleur du soir ;
Image 4 : titre "DREAM ON", ambiance nocturne.
Garder la couleur de marque marron/or, grille et marges cohérentes, éclairage cinématographique.

Exemple d’API : Génération séquentielle

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Générer 4 images d'une basket dans différents coloris. Image 1 : blanc/bleu ; Image 2 : noir/or ; Image 3 : rouge/blanc ; Image 4 : vert/crème. Éclairage studio, angle et composition identiques, fond propre.",
        "max_images": 4,
    },
)

for url in output["outputs"]:
    print(url)

Note sur les coûts : Le modèle séquentiel facture par max_images, et non par sortie réelle. Si vous définissez max_images=4 mais ne décrivez que 2 images dans votre prompt, vous serez quand même facturé pour 4. Faites toujours correspondre le nombre dans votre prompt à max_images.


Seedream 4.5 : Typographie et édition approfondie

Seedream 4.5 s’appuie sur la version 4.0 avec des améliorations significatives en matière de rendu de texte, d’adhérence aux prompts, de qualité esthétique et de cohérence des images de référence. C’est le choix recommandé pour tout travail impliquant de la typographie, des visuels de marque ou de l’édition de portraits.

Améliorations clés par rapport à la version 4.0

  • Typographie améliorée : Texte net et lisible pour les affiches, logos, interfaces et mises en page marketing
  • Composition de niveau designer : Gère des mises en page complexes de type affiche avec une hiérarchie claire
  • Meilleure adhérence aux prompts : Suit fidèlement les descriptions détaillées des sujets, de la mise en page et du style
  • Résolution plus élevée : Prend en charge 2560x1440 jusqu’à 4096x4096 (minimum plus élevé que V4)
  • Meilleure cohérence des références : Préserve les traits du visage, l’éclairage et le ton des couleurs des images de référence

Variantes de modèles

Comme la V4, Seedream 4.5 propose quatre variantes sur WaveSpeedAI :

VarianteChemin du modèleTypeCas d’usage
Basebytedance/seedream-v4.5Texte-vers-imageAffiches à forte typographie, visuels de marque
Editbytedance/seedream-v4.5/editImage-vers-imageÉdition de portraits, retouche de produits
Sequentialbytedance/seedream-v4.5/sequentialT2I par lotSéries cohérentes, ensembles de campagnes
Edit-Sequentialbytedance/seedream-v4.5/edit-sequentialI2I par lotFusion multi-images, transferts de style

Résolutions recommandées (V4.5)

Ratio d’aspectRésolution suggérée
1:12048x2048
4:32688x2016
3:22688x1792
16:92560x1440
Carré 4K4096x4096

Meilleures pratiques pour le rendu de texte

La fonctionnalité phare de Seedream 4.5 est la génération précise de texte dans les images. Suivez ces directives pour de meilleurs résultats :

  1. Utilisez des guillemets doubles autour du texte qui doit apparaître dans l’image : Générer une affiche avec le titre "Seedream 4.5"
  2. Spécifiez les caractéristiques de la police : “sans-serif gras”, “script élégant”, “manuscrit”
  3. Décrivez le placement du texte : “titre en haut au centre”, “sous-titre en dessous”, “CTA en bas à droite”
  4. Gardez le texte court : 1 à 10 mots fonctionnent mieux ; les longs paragraphes peuvent présenter des incohérences
  5. Utilisez des résolutions plus élevées : 2048x2048 ou supérieur donne une typographie nettement plus propre

Exemple : Affiche de marque

Affiche minimaliste de conférence tech, fond bleu marine foncé.
Grand titre blanc en majuscules en haut : "AI SUMMIT 2026".
Petit sous-titre gris en dessous : "San Francisco • 15-17 juin".
Forme géométrique holographique abstraite centrée.
Accent couleur de marque #3CA2F6. Mise en page en grille propre, généreux espaces blancs.

Exemple d’API : Génération à forte typographie

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {
        "prompt": "Tableau de menu de café, style ardoise, titre 'SPÉCIALITÉS DU JOUR' en lettres de craie grasses, éléments : Espresso 3€, Latte 4€, Cappuccino 4,50€, éclairage ambiant chaud, atmosphère de café cosy",
        "size": "2048x2048",
    },
)

print(output["outputs"][0])

Génération basée sur des références (V4.5 Edit)

Seedream 4.5 Edit excelle dans l’extraction et la préservation des caractéristiques visuelles des images de référence :

Transfert d’étalonnage des couleurs

Changer le ton colorimétrique de l'Image 1 pour correspondre au ton colorimétrique de l'Image 2

Transfert de maquillage

Transférer le maquillage de l'Image 2 sur la personne de l'Image 1

Application du style de marque

Appliquer le style de design de marque de l'Image 1 au produit de l'Image 2,
créer une image promotionnelle de série de marque similaire,
inclure tous les modules de design de l'Image 1

Seedream 5.0-Preview : Intelligence et raisonnement

Seedream 5.0-Preview introduit des capacités qui vont au-delà de la génération d’images traditionnelle. Il donne la priorité à la connaissance et à l’intelligence plutôt qu’à la pure esthétique, en ajoutant la recherche web en temps réel, un contrôle d’édition précis et un raisonnement logique avancé.

Note : Pour la beauté visuelle pure et le photoréalisme, Seedream 4.5 reste le choix recommandé. La version complète 5.0 combinera intelligence et esthétique.

Recherche web en temps réel

5.0-Preview est le premier modèle de génération d’images à prendre en charge la génération basée sur la recherche. Le modèle détermine intelligemment quand effectuer une recherche en fonction de votre prompt :

  • Termes sensibles au temps : Sorties de produits récentes, actualités
  • Entités spécifiques : Célébrités, marques, lieux
  • Requêtes de longue traîne : Sujets de niche nécessitant une précision factuelle

Exemples de prompts déclenchant une recherche :

Générer un concept design d'iPhone 17 Pro Max
Faire référence à l'interface de l'application Duolingo, concevoir une page de fiches
de vocabulaire avec un mot et un compteur de séries, incorporer
la mascotte hibou vert
Générer une affiche des Jeux Olympiques d'Hiver nordiques : arrière-plan aurore
norvégienne, skieur en uniforme national, inclure les
éléments et la mascotte olympiques

Raisonnement logique intelligent

5.0-Preview gère des opérations complexes nécessitant la compréhension du contexte et la prise de décision en plusieurs étapes :

Classification et distribution

Classer les fleurs de l'Image 1 par variété, les disposer
séparément dans les trois vases montrés dans l'Image 2

Compréhension du monde physique

Deux règles de bureau, celle du haut est une règle en plastique de 20 cm,
celle du bas est une règle en acier de 10 cm

Raisonnement 3D

Générer la forme assemblée en 3D basée sur le diagramme de mise à plat
de l'emballage

Connaissances spécialisées

Faire référence à cet ensemble de dessins CAO, générer une
visualisation réaliste du bâtiment
Diagramme de vue antérieure du système respiratoire humain montrant :
cavité nasale, narines, cavité buccale, pharynx, larynx,
trachée, bronches principales gauche et droite, poumons gauche et droit,
et diaphragme

Édition basée sur des exemples

Au lieu de décrire des transformations complexes, montrez au modèle ce que vous voulez avec des exemples avant/après :

Faire référence au changement de l'Image 1 vers l'Image 2, appliquer la
même opération à l'Image 3

Cela fonctionne pour les changements de coiffure, les permutations de scènes, les transformations de matériaux et les changements de perspective.


Guide d’ingénierie des prompts

Ces conseils s’appliquent à toutes les versions Seedream 4.0–5.0.

Utilisez le langage naturel, pas des listes de tags

Rédigez des récits cohérents plutôt que des listes de mots-clés fragmentés :

À éviter :

fille, robe somptueuse, ombrelle, allée bordée d'arbres, peinture à l'huile, style Monet

Préférez :

Une fille en robe somptueuse se promenant sous une ombrelle le long d'une allée bordée d'arbres,
dans le style d'une peinture à l'huile de Monet

Formule de structure de prompt

[Sujet] + [Action/Pose] + [Environnement/Cadre] + [Style] + [Détails techniques] + [Contenu textuel]

Exemple :

Un barista professionnel (sujet) créant un latte art (action) dans un café
spécialisé moderne (environnement), style photoréaliste (style),
lumière matinale chaude à travers de grandes fenêtres, faible profondeur de champ (technique),
une ardoise derrière lui sur laquelle on lit "ARTISAN ROASTERS" (contenu textuel)

Prompts d’édition

Pour l’édition d’images, utilisez des instructions spécifiques et sans ambiguïté qui précisent explicitement ce qui change et ce qui reste pareil :

À éviter : Rends-le plus beau

Préférez : Remplacer le ciel couvert par un fond de coucher de soleil vivant, tons orange chauds ; garder le bâtiment et le premier plan inchangés

Balisage visuel pour les éditions complexes

Lorsque les descriptions textuelles seules ne suffisent pas pour un positionnement précis, utilisez des flèches, des cadres de délimitation ou des gribouillis sur l’image de référence pour désigner des régions spécifiques à modifier.

Erreurs courantes

  1. Instructions contradictoires : “Personnage de dessin animé photoréaliste” — choisissez une direction de style
  2. Surcompliquer les prompts : Commencez simplement, ajoutez des détails progressivement
  3. Ignorer le ratio d’aspect : Adaptez les dimensions à votre cas d’usage (carré pour les réseaux sociaux, paysage pour les bannières)
  4. Instructions d’édition vagues : Évitez les pronoms comme “le changer” — spécifiez ce qu’est “le”

Choisir la bonne version

Guide de décision rapide

  • Besoin de vitesse et de faible coût ? → Seedream 4.0
  • Besoin de texte net dans les images ? → Seedream 4.5
  • Besoin d’affiches de qualité professionnelle ? → Seedream 4.5
  • Besoin d’ensembles multi-images cohérents ? → V4 ou V4.5 Sequential
  • Besoin d’éditer des photos existantes ? → V4 ou V4.5 Edit
  • Besoin d’images sur des événements actuels ? → Seedream 5.0-Preview
  • Besoin de contenu basé sur des connaissances ? → Seedream 5.0-Preview

Comparaison détaillée

Capacité4.04.55.0-Preview
Texte-vers-imageOuiOuiOui
Édition d’imagesOuiOui (meilleure)Oui
Multi-imagesOuiOuiOui
Génération séquentielleOuiOuiOui
Rendu de texteBonExcellentBon
Recherche webNonNonOui
Raisonnement logiqueBasiqueBasiqueAvancé
Résolution max4096x40964096x40964K
Résolution min~320x3202560x1440
VitesseLa plus rapideModéréeModérée
Coût0,027 $0,04 $

Limites des versions

Seedream 4.0 : Le texte de petite taille peut se répéter ou se dégrader ; précision de l’édition inférieure à la version 4.5.

Seedream 4.5 : Problèmes occasionnels de flou ou de recadrage ; coût et temps de génération plus élevés que la version 4.0.

Seedream 5.0-Preview : Apparence générée par IA parfois perceptible ; problèmes de proportions occasionnels ; instabilité de la structure du texte ; raisonnement sur les graphiques/données limité. Donne actuellement la priorité à l’intelligence sur l’esthétique.


Tous les modèles disponibles sur WaveSpeedAI

ModèleTypePrixIdéal pour
bytedance/seedream-v4Texte-vers-image0,027 $Affiches, mises en page en grille, designs conceptuels
bytedance/seedream-v4/editImage-vers-image0,027 $Changements de tenue, modifications d’arrière-plan, retouche
bytedance/seedream-v4/sequentialT2I par lot0,027 $/imageFiches personnages, ensembles de campagnes
bytedance/seedream-v4/edit-sequentialI2I par lot0,027 $/imageFusion multi-images, variantes A/B
bytedance/seedream-v4.5Texte-vers-image0,04 $Typographie, visuels de marque, affiches 4K
bytedance/seedream-v4.5/editImage-vers-image0,04 $Édition de portraits, transfert de style/caractéristiques
bytedance/seedream-v4.5/sequentialT2I par lot0,04 $/imageSéries de marque, campagnes cohérentes
bytedance/seedream-v4.5/edit-sequentialI2I par lot0,04 $/imageÉdition multi-images, exploration de design
bytedance/seedream-v5.0-liteTexte-vers-image0,035 $Génération basée sur les connaissances, recherche web
bytedance/seedream-v5.0-lite/editImage-vers-image0,035 $Édition intelligente, transfert de caractéristiques
bytedance/seedream-v5.0-lite/sequentialT2I par lot0,035 $/imageSéries intelligentes cohérentes
bytedance/seedream-v5.0-lite/edit-sequentialI2I par lot0,035 $/imageÉdition multi-images intelligente

Démarrage

  1. Inscrivez-vous sur WaveSpeedAI et obtenez votre clé API
  2. Installez le SDK : pip install wavespeed
  3. Choisissez votre modèle en fonction du guide de décision ci-dessus
  4. Rédigez votre prompt en utilisant la formule de structure et les meilleures pratiques
  5. Générez et itérez : Affinez les prompts en fonction des résultats
import wavespeed

# Texte-vers-image avec Seedream 4.5
output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {"prompt": "Une affiche de présentation de produit élégante, titre 'NEXT GEN' en sans-serif blanc gras, arrière-plan en dégradé sombre, smartphone flottant avec écran holographique, éclairage cinématographique, couleur de marque #3CA2F6"},
)

print(output["outputs"][0])
import wavespeed

# Édition d'images avec Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Changer la tenue pour un costume noir formel, garder la même pose et l'éclairage de l'arrière-plan",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])
import wavespeed

# Génération séquentielle avec Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Générer 3 visuels tutoriels étape par étape pour préparer un café en filtration. Image 1 : mouture des grains ; Image 2 : versement de l'eau en mouvement circulaire ; Image 3 : tasse terminée avec vapeur. Style chaud uniforme, étiquettes numérotées.",
        "max_images": 3,
    },
)

for url in output["outputs"]:
    print(url)

Que vous construisiez de l’automatisation marketing, créiez du contenu pour les réseaux sociaux à grande échelle ou développiez des applications créatives, la famille Seedream 4.0–5.0 sur WaveSpeedAI offre le spectre complet, de l’itération rapide à la génération intelligente basée sur les connaissances.