← Blog

Tutorial Completo de Seedream 4.0 a 5.0: Geração de Texto para Imagem, Edição e Criação de Múltiplas Imagens

Domine a família de modelos Seedream da ByteDance, do 4.0 ao 5.0. Aprenda geração de texto para imagem, edição de imagens, criação sequencial de múltiplas imagens, engenharia de prompts e como escolher a versão certa para o seu fluxo de trabalho.

16 min read

A família Seedream da ByteDance evoluiu rapidamente da versão 4.0 para a 5.0, com cada lançamento trazendo novas capacidades para geração de imagens, edição e raciocínio inteligente. Este tutorial cobre toda a gama 4.0–5.0 — o que cada versão faz melhor, quais variantes de modelo usar e como obter resultados com qualidade de produção através da API do WaveSpeedAI.


Visão Geral da Família de Modelos

A linha Seedream 4.0–5.0 suporta três tipos de entrada — texto, uma única imagem e múltiplas imagens — permitindo geração de texto para imagem, edição de imagens, fusão de múltiplas imagens e geração em lote sequencial com consistência temática.

Cada versão principal tem pontos fortes distintos:

VersãoPosicionamentoIdeal ParaPreço (WaveSpeedAI)
4.0Alta EficiênciaIteração rápida, pôsteres com layout, designs em grade, produção com custo reduzido$0,027/imagem
4.5Edição Profunda e TipografiaRetratos, visuais de marca, renderização de texto nítida, composição de pôsteres 4K$0,04/imagem
5.0-Lite5.0 LeveGeração e edição 5.0 rápidas, ponto de entrada acessívelDisponível agora
5.0-PreviewConhecimento e RaciocínioTópicos em tendência, pesquisa web, raciocínio lógico, conteúdo específico de domínioEm breve

Seedream 4.0: Geração com Consciência de Layout

O Seedream 4.0 é otimizado para pôsteres de múltiplos painéis, designs conceituais com texto, visuais-chave (KV) de séries e materiais para redes sociais. Destaca-se em layouts baseados em grade, planejamento de espaço em branco para títulos e subtítulos, e melhoria da legibilidade do texto.

Especificações Principais

  • Saída padrão: 2048x2048 (2K)
  • Resolução máxima: 4096x4096
  • Velocidade de inferência: ~1,8s para uma imagem 2K
  • Proporções de aspecto: 1:1, 3:2, 4:3, 16:9, 21:9 e personalizado

Variantes do Modelo

O Seedream 4.0 vem com quatro variantes no WaveSpeedAI, cada uma projetada para um fluxo de trabalho diferente:

bytedance/seedream-v4 — Texto para imagem. Gera imagens a partir de prompts de texto. Ideal para pôsteres, arte conceitual e gráficos para redes sociais.

bytedance/seedream-v4/edit — Imagem para imagem. Modifica imagens existentes: trocas de roupa, substituição de fundo, mudanças de material, redesign de interiores. Suporta até 10 imagens de referência.

bytedance/seedream-v4/sequential — Texto para imagem em lote. Gera múltiplas imagens de uma vez com consistência entre imagens. Perfeito para folhas de personagens, campanhas publicitárias e diagramas de etapas.

bytedance/seedream-v4/edit-sequential — Imagem para imagem em lote. Entrada de múltiplas imagens com saída em lote. Permite fusão de múltiplas imagens, transferências de estilo em conjuntos e comparações de variantes A/B.

Prompts de Texto para Imagem (V4)

Ao criar prompts para o Seedream 4.0, especifique o assunto, o layout (grade, tríptico, etc.), o posicionamento do texto (título, subtítulo, CTA) e o estilo preferido.

Pôster em Grade 2x2

Layout de pôster em grade 2x2, margens limpas para tipografia, título centralizado no topo:
"COLEÇÃO DE VERÃO", subtítulo: "Novidades 2026". Painel 1: resort à beira-mar;
Painel 2: coquetel ao pôr do sol; Painel 3: flores tropicais; Painel 4: ondas do oceano.
Gradação de cores consistente, iluminação cinematográfica, cor da marca #3CA2F6,
fundo de alta legibilidade, mínima desordem visual

Tríptico

Painéis em tríptico horizontal, narrativa da esquerda para a direita: nascer do sol na montanha ->
trilha de caminhada -> celebração no cume, paleta unificada em tons terrosos quentes,
vinheta suave, calhas claras, hierarquia tipográfica forte,
espaço reservado para CTA "COMECE SUA AVENTURA"

Pôster Minimalista

Pôster minimalista, título grande ao centro: "SUMMIT DE INOVAÇÃO", subtítulo pequeno
abaixo: "Março 2026 • São Francisco", objeto focal único: escultura geométrica abstrata,
monocromático + destaque #3CA2F6, fundo de alta legibilidade,
layout baseado em grade

Tira em Quadrinhos

Layout de tira em quadrinhos de 4 painéis, espaços reservados para balões de fala.
Painel 1: desenvolvedor olha fixo para a tela; Painel 2: IA gera solução;
Painel 3: desenvolvedor comemora; Painel 4: "Era tão simples assim?"
Arte em traço grosso, sombreamento plano, calhas claras, alta legibilidade

Exemplo de API: Texto para Imagem

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4",
    {"prompt": "Pôster em grade 2x2, título: 'EXPO TECH 2026', quatro conceitos de produtos futuristas, margens limpas, iluminação cinematográfica, cor da marca azul"},
)

print(output["outputs"][0])

Edição de Imagens (V4 Edit)

A variante de edição modifica imagens existentes preservando a identidade do assunto, iluminação e composição. Use prompts claros e estruturados seguindo o padrão: ação + objeto + característica alvo + restrições.

Troca de Roupa

Troca de roupa para retrato, substituir vestimenta por elegante blazer azul-marinho;
manter pose e composição; acessórios: relógio dourado;
maquiagem/cabelo sem alteração; preservar tom de pele e iluminação;
bordas limpas, sem artefatos

Substituição de Fundo

Substituição de fundo para o sujeito, manter bordas do sujeito;
novo ambiente: escritório moderno com janelas do chão ao teto;
corresponder direção e temperatura de cor da luz;
sombras de contato suaves; sem halo

Redesign de Interior

Troca de acabamento interior, atualizar parede para tijolo aparente,
piso para madeira escura, estofamento de móveis para linho carvão;
layout e iluminação sem alteração; texturas PBR realistas

Exemplo de API: Edição de Imagens

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Substituir o fundo por uma praia tropical ao pôr do sol, corresponder direção da luz, sombras suaves",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])

Geração Sequencial (V4 Sequential)

A variante sequencial gera múltiplas imagens em uma única chamada com estilo, identidade e paleta consistentes em todo o conjunto. Você deve especificar o número de imagens tanto no prompt quanto no parâmetro max_images.

Folha de Design de Personagem

Gerar 6 folhas de personagem de um hacker cyberpunk.
Imagem 1: pose neutra; Imagem 2: pose de ação; Imagem 3: perfil lateral;
Imagem 4: vista traseira; Imagem 5: expressão feliz; Imagem 6: expressão séria.
Mesma roupa e paleta, estilo de turnaround limpo.

Campanha Publicitária

Gerar 4 conceitos de pôster da mesma campanha de marca de café.
Imagem 1: manchete "ACORDE", luz matinal;
Imagem 2: manchete "RECARREGUE", energia da tarde;
Imagem 3: manchete "DESACELERE", calor da noite;
Imagem 4: manchete "SONHE ALTO", ambiente noturno.
Manter cor da marca marrom/dourado, grade e margens consistentes, iluminação cinematográfica.

Exemplo de API: Geração Sequencial

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Gerar 4 imagens de um tênis em diferentes combinações de cores. Imagem 1: branco/azul; Imagem 2: preto/dourado; Imagem 3: vermelho/branco; Imagem 4: verde/creme. Iluminação de estúdio, ângulo e composição idênticos, fundo limpo.",
        "max_images": 4,
    },
)

for url in output["outputs"]:
    print(url)

Nota sobre custo: O modelo sequencial cobra por max_images, não pela saída real. Se você definir max_images=4 mas descrever apenas 2 imagens no seu prompt, ainda será cobrado por 4. Sempre corresponda o número no seu prompt ao max_images.


Seedream 4.5: Tipografia e Edição Profunda

O Seedream 4.5 aprimora o 4.0 com melhorias significativas em renderização de texto, aderência ao prompt, qualidade estética e consistência de imagens de referência. É a escolha recomendada para qualquer trabalho envolvendo tipografia, visuais de marca ou edição de retratos.

Principais Melhorias em Relação ao 4.0

  • Tipografia aprimorada: Texto nítido e legível para pôsteres, logotipos, UI e layouts de marketing
  • Composição em nível de designer: Lida com layouts complexos no estilo de pôsteres com hierarquia clara
  • Maior aderência ao prompt: Segue de perto descrições detalhadas de assuntos, layout e estilo
  • Resolução mais alta: Suporta 2560x1440 até 4096x4096 (mínimo maior que o V4)
  • Melhor consistência de referência: Preserva características faciais, iluminação e tom de cor de imagens de referência

Variantes do Modelo

Assim como o V4, o Seedream 4.5 oferece quatro variantes no WaveSpeedAI:

VarianteCaminho do ModeloTipoCaso de Uso
Basebytedance/seedream-v4.5Texto para ImagemPôsteres com muita tipografia, visuais de marca
Editbytedance/seedream-v4.5/editImagem para ImagemEdição de retratos, retoque de produtos
Sequentialbytedance/seedream-v4.5/sequentialLote T2ISéries consistentes, conjuntos de campanhas
Edit-Sequentialbytedance/seedream-v4.5/edit-sequentialLote I2IFusão de múltiplas imagens, transferências de estilo

Resoluções Recomendadas (V4.5)

Proporção de AspectoResolução Sugerida
1:12048x2048
4:32688x2016
3:22688x1792
16:92560x1440
Quadrado 4K4096x4096

Melhores Práticas de Renderização de Texto

O destaque do Seedream 4.5 é a geração precisa de texto dentro das imagens. Siga estas diretrizes para melhores resultados:

  1. Use aspas duplas ao redor do texto que deve aparecer na imagem: Gerar um pôster com o título "Seedream 4.5"
  2. Especifique as características da fonte: “negrito sem serifa”, “script elegante”, “manuscrito”
  3. Descreva o posicionamento do texto: “título centralizado no topo”, “subtítulo abaixo”, “CTA inferior direito”
  4. Mantenha o texto curto: 1–10 palavras funcionam melhor; parágrafos longos podem ter inconsistências
  5. Use resoluções mais altas: 2048x2048 ou acima oferece tipografia notavelmente mais limpa

Exemplo: Pôster de Marca

Pôster minimalista para conferência de tecnologia, fundo azul-marinho escuro.
Grande título branco em caixa alta no topo: "AI SUMMIT 2026".
Pequeno subtítulo cinza abaixo: "São Francisco • 15-17 de junho".
Forma geométrica holográfica abstrata centralizada.
Destaque de cor da marca #3CA2F6. Layout de grade limpo, generoso espaço em branco.

Exemplo de API: Geração com Muita Tipografia

import wavespeed

output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {
        "prompt": "Quadro de menu de cafeteria, estilo lousa, título 'ESPECIAIS DO DIA' em letras de giz em negrito, itens: Espresso R$15, Latte R$20, Cappuccino R$22, iluminação ambiente quente, atmosfera aconchegante de café",
        "size": "2048x2048",
    },
)

print(output["outputs"][0])

Geração Baseada em Referência (V4.5 Edit)

O Seedream 4.5 Edit destaca-se em extrair e preservar características visuais de imagens de referência:

Transferência de Gradação de Cor

Alterar o tom de cor da Imagem 1 para corresponder ao tom de cor da Imagem 2

Transferência de Maquiagem

Transferir a maquiagem da Imagem 2 para a pessoa na Imagem 1

Aplicação de Estilo de Marca

Aplicar o estilo de design de marca da Imagem 1 ao produto na Imagem 2,
criar uma imagem promocional de série de marca similar,
incluir todos os módulos de design da Imagem 1

Seedream 5.0-Preview: Inteligência e Raciocínio

O Seedream 5.0-Preview introduz capacidades que vão além da geração tradicional de imagens. Prioriza conhecimento e inteligência em detrimento da estética pura, adicionando pesquisa web em tempo real, controle preciso de edição e raciocínio lógico avançado.

Nota: Para beleza visual pura e fotorrealismo, o Seedream 4.5 continua sendo a escolha recomendada. O lançamento completo do 5.0 combinará inteligência e estética.

Pesquisa Web em Tempo Real

O 5.0-Preview é o primeiro modelo de geração de imagens a suportar geração baseada em pesquisa. O modelo determina inteligentemente quando pesquisar com base no seu prompt:

  • Termos sensíveis ao tempo: Lançamentos recentes de produtos, eventos atuais
  • Entidades específicas: Celebridades, marcas, locais
  • Consultas de cauda longa: Tópicos de nicho que exigem precisão factual

Exemplos de prompts que acionam a pesquisa:

Gerar conceito de design do iPhone 17 Pro Max
Referenciar a interface do aplicativo Duolingo, projetar uma
página de cartão de vocabulário com palavra e contador de sequência, incorporar
a mascote coruja verde
Gerar pôster das Olimpíadas de Inverno Nórdico: fundo de aurora norueguesa,
esquiador em uniforme nacional, incluir
elementos olímpicos e mascote

Raciocínio Lógico Inteligente

O 5.0-Preview lida com operações complexas que requerem compreensão de contexto e tomada de decisão em múltiplas etapas:

Classificação e Distribuição

Classificar as flores na Imagem 1 por variedade, organizá-las
separadamente nos três vasos mostrados na Imagem 2

Compreensão do Mundo Físico

Duas réguas de papelaria, a de cima é uma régua de plástico de 20cm,
a de baixo é uma régua de aço de 10cm

Raciocínio 3D

Gerar a forma 3D montada com base no
diagrama de layout plano da embalagem

Conhecimento Específico de Domínio

Referenciar este conjunto de desenhos CAD, gerar uma visualização
realista do edifício
Diagrama de vista anterior do sistema respiratório humano mostrando:
cavidade nasal, narinas, cavidade oral, faringe, laringe,
traqueia, brônquios principais esquerdo e direito, pulmões esquerdo e direito,
e diafragma

Edição Baseada em Exemplos

Em vez de descrever transformações complexas, mostre ao modelo o que você deseja com exemplos de antes/depois:

Referenciar a mudança da Imagem 1 para a Imagem 2, aplicar a
mesma operação na Imagem 3

Isso funciona para mudanças de penteado, trocas de cena, transformações de material e mudanças de perspectiva.


Guia de Engenharia de Prompts

Estas dicas se aplicam a todas as versões Seedream 4.0–5.0.

Use Linguagem Natural, Não Listas de Tags

Escreva narrativas coerentes em vez de listas fragmentadas de palavras-chave:

Evite:

menina, vestido luxuoso, sombrinha, alameda arborizada, pintura a óleo, estilo Monet

Prefira:

Uma menina em um vestido luxuoso caminhando sob uma sombrinha ao longo de uma alameda arborizada,
no estilo de uma pintura a óleo de Monet

Fórmula de Estrutura de Prompt

[Assunto] + [Ação/Pose] + [Ambiente/Cenário] + [Estilo] + [Detalhes Técnicos] + [Conteúdo de Texto]

Exemplo:

Um barista profissional (assunto) criando arte latte (ação) em uma moderna
cafeteria especializada (ambiente), estilo fotorrealista (estilo),
luz matinal quente através de grandes janelas, profundidade de campo rasa (técnico),
uma lousa atrás deles lendo "TORREFADORES ARTESANAIS" (conteúdo de texto)

Prompts de Edição

Para edição de imagens, use instruções específicas e inequívocas que declarem explicitamente o que muda e o que permanece igual:

Evite: Deixe melhor

Prefira: Substituir o céu encoberto por um cenário de pôr do sol vívido, tons alaranjados quentes; manter o edifício e o primeiro plano sem alterações

Marcação Visual para Edições Complexas

Quando as descrições de texto sozinhas não são suficientes para posicionamento preciso, use setas, caixas delimitadoras ou rabiscos na imagem de referência para designar regiões específicas para modificação.

Erros Comuns

  1. Instruções conflitantes: “Personagem de desenho animado fotorrealista” — escolha uma direção de estilo
  2. Prompts excessivamente complicados: Comece simples, adicione detalhes incrementalmente
  3. Ignorar a proporção de aspecto: Combine dimensões ao seu caso de uso (quadrado para redes sociais, paisagem para banners)
  4. Instruções de edição vagas: Evite pronomes como “mude isso” — especifique o que é “isso”

Escolhendo a Versão Correta

Guia de Decisão Rápida

  • Precisa de velocidade e baixo custo? → Seedream 4.0
  • Precisa de texto nítido nas imagens? → Seedream 4.5
  • Precisa de pôsteres com qualidade de marca? → Seedream 4.5
  • Precisa de conjuntos consistentes de múltiplas imagens? → V4 ou V4.5 Sequential
  • Precisa editar fotos existentes? → V4 ou V4.5 Edit
  • Precisa de imagens de eventos atuais? → Seedream 5.0-Preview
  • Precisa de conteúdo baseado em conhecimento? → Seedream 5.0-Preview

Comparação Detalhada

Capacidade4.04.55.0-Preview
Texto para ImagemSimSimSim
Edição de ImagensSimSim (melhor)Sim
Múltiplas ImagensSimSimSim
Geração SequencialSimSimSim
Renderização de TextoBoaExcelenteBoa
Pesquisa WebNãoNãoSim
Raciocínio LógicoBásicoBásicoAvançado
Resolução Máxima4096x40964096x40964K
Resolução Mínima~320x3202560x1440
VelocidadeMais rápidaModeradaModerada
Custo$0,027$0,04

Limitações das Versões

Seedream 4.0: Textos pequenos podem se repetir ou degradar; precisão de edição menor que o 4.5.

Seedream 4.5: Ocasionais problemas de desfoque ou corte; custo e tempo de geração maiores que o 4.0.

Seedream 5.0-Preview: Aparência ocasionalmente gerada por IA; problemas ocasionais de proporção; instabilidade de estrutura de texto; raciocínio limitado sobre gráficos/dados. Atualmente prioriza inteligência sobre estética.


Todos os Modelos Disponíveis no WaveSpeedAI

ModeloTipoPreçoIdeal Para
bytedance/seedream-v4Texto para Imagem$0,027Pôsteres, layouts em grade, designs conceituais
bytedance/seedream-v4/editImagem para Imagem$0,027Trocas de roupa, mudanças de fundo, retoque
bytedance/seedream-v4/sequentialLote T2I$0,027/imagemFolhas de personagens, conjuntos de campanhas
bytedance/seedream-v4/edit-sequentialLote I2I$0,027/imagemFusão de múltiplas imagens, variantes A/B
bytedance/seedream-v4.5Texto para Imagem$0,04Tipografia, visuais de marca, pôsteres 4K
bytedance/seedream-v4.5/editImagem para Imagem$0,04Edição de retratos, transferência de estilo/característica
bytedance/seedream-v4.5/sequentialLote T2I$0,04/imagemSéries de marca, campanhas consistentes
bytedance/seedream-v4.5/edit-sequentialLote I2I$0,04/imagemEdição de múltiplas imagens, exploração de design
bytedance/seedream-v5.0-liteTexto para Imagem$0,035Geração baseada em conhecimento, pesquisa web
bytedance/seedream-v5.0-lite/editImagem para Imagem$0,035Edição inteligente, transferência de característica
bytedance/seedream-v5.0-lite/sequentialLote T2I$0,035/imagemSéries inteligentes consistentes
bytedance/seedream-v5.0-lite/edit-sequentialLote I2I$0,035/imagemEdição inteligente de múltiplas imagens

Primeiros Passos

  1. Cadastre-se no WaveSpeedAI e obtenha sua chave de API
  2. Instale o SDK: pip install wavespeed
  3. Escolha seu modelo com base no guia de decisão acima
  4. Escreva seu prompt usando a fórmula de estrutura e as melhores práticas
  5. Gere e itere: Refine os prompts com base nos resultados
import wavespeed

# Texto para Imagem com Seedream 4.5
output = wavespeed.run(
    "bytedance/seedream-v4.5",
    {"prompt": "Um pôster elegante de apresentação de produto, título 'PRÓXIMA GERAÇÃO' em negrito sans-serif branco, fundo com gradiente escuro, smartphone flutuante com tela holográfica, iluminação cinematográfica, cor da marca #3CA2F6"},
)

print(output["outputs"][0])
import wavespeed

# Edição de Imagens com Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/edit",
    {
        "prompt": "Mudar a roupa para um terno preto formal, manter a mesma pose e iluminação do fundo",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])
import wavespeed

# Geração Sequencial com Seedream 4.0
output = wavespeed.run(
    "bytedance/seedream-v4/sequential",
    {
        "prompt": "Gerar 3 visuais tutoriais passo a passo para fazer café pour-over. Imagem 1: moendo os grãos; Imagem 2: despejando água em movimento circular; Imagem 3: xícara finalizada com vapor. Estilo quente uniforme, rótulos numerados.",
        "max_images": 3,
    },
)

for url in output["outputs"]:
    print(url)

Seja para construir automação de marketing, criar conteúdo para redes sociais em escala ou desenvolver aplicações criativas, a família Seedream 4.0–5.0 no WaveSpeedAI oferece o espectro completo, desde iteração rápida até geração inteligente e baseada em conhecimento.

Compartilhar