Tutorial Completo de Seedream 4.0 a 5.0: Geração de Texto para Imagem, Edição e Criação de Múltiplas Imagens
Domine a família de modelos Seedream da ByteDance, do 4.0 ao 5.0. Aprenda geração de texto para imagem, edição de imagens, criação sequencial de múltiplas imagens, engenharia de prompts e como escolher a versão certa para o seu fluxo de trabalho.
A família Seedream da ByteDance evoluiu rapidamente da versão 4.0 para a 5.0, com cada lançamento trazendo novas capacidades para geração de imagens, edição e raciocínio inteligente. Este tutorial cobre toda a gama 4.0–5.0 — o que cada versão faz melhor, quais variantes de modelo usar e como obter resultados com qualidade de produção através da API do WaveSpeedAI.
Visão Geral da Família de Modelos
A linha Seedream 4.0–5.0 suporta três tipos de entrada — texto, uma única imagem e múltiplas imagens — permitindo geração de texto para imagem, edição de imagens, fusão de múltiplas imagens e geração em lote sequencial com consistência temática.
Cada versão principal tem pontos fortes distintos:
| Versão | Posicionamento | Ideal Para | Preço (WaveSpeedAI) |
|---|---|---|---|
| 4.0 | Alta Eficiência | Iteração rápida, pôsteres com layout, designs em grade, produção com custo reduzido | $0,027/imagem |
| 4.5 | Edição Profunda e Tipografia | Retratos, visuais de marca, renderização de texto nítida, composição de pôsteres 4K | $0,04/imagem |
| 5.0-Lite | 5.0 Leve | Geração e edição 5.0 rápidas, ponto de entrada acessível | Disponível agora |
| 5.0-Preview | Conhecimento e Raciocínio | Tópicos em tendência, pesquisa web, raciocínio lógico, conteúdo específico de domínio | Em breve |
Seedream 4.0: Geração com Consciência de Layout
O Seedream 4.0 é otimizado para pôsteres de múltiplos painéis, designs conceituais com texto, visuais-chave (KV) de séries e materiais para redes sociais. Destaca-se em layouts baseados em grade, planejamento de espaço em branco para títulos e subtítulos, e melhoria da legibilidade do texto.
Especificações Principais
- Saída padrão: 2048x2048 (2K)
- Resolução máxima: 4096x4096
- Velocidade de inferência: ~1,8s para uma imagem 2K
- Proporções de aspecto: 1:1, 3:2, 4:3, 16:9, 21:9 e personalizado
Variantes do Modelo
O Seedream 4.0 vem com quatro variantes no WaveSpeedAI, cada uma projetada para um fluxo de trabalho diferente:
bytedance/seedream-v4 — Texto para imagem. Gera imagens a partir de prompts de texto. Ideal para pôsteres, arte conceitual e gráficos para redes sociais.
bytedance/seedream-v4/edit — Imagem para imagem. Modifica imagens existentes: trocas de roupa, substituição de fundo, mudanças de material, redesign de interiores. Suporta até 10 imagens de referência.
bytedance/seedream-v4/sequential — Texto para imagem em lote. Gera múltiplas imagens de uma vez com consistência entre imagens. Perfeito para folhas de personagens, campanhas publicitárias e diagramas de etapas.
bytedance/seedream-v4/edit-sequential — Imagem para imagem em lote. Entrada de múltiplas imagens com saída em lote. Permite fusão de múltiplas imagens, transferências de estilo em conjuntos e comparações de variantes A/B.
Prompts de Texto para Imagem (V4)
Ao criar prompts para o Seedream 4.0, especifique o assunto, o layout (grade, tríptico, etc.), o posicionamento do texto (título, subtítulo, CTA) e o estilo preferido.
Pôster em Grade 2x2
Layout de pôster em grade 2x2, margens limpas para tipografia, título centralizado no topo:
"COLEÇÃO DE VERÃO", subtítulo: "Novidades 2026". Painel 1: resort à beira-mar;
Painel 2: coquetel ao pôr do sol; Painel 3: flores tropicais; Painel 4: ondas do oceano.
Gradação de cores consistente, iluminação cinematográfica, cor da marca #3CA2F6,
fundo de alta legibilidade, mínima desordem visual
Tríptico
Painéis em tríptico horizontal, narrativa da esquerda para a direita: nascer do sol na montanha ->
trilha de caminhada -> celebração no cume, paleta unificada em tons terrosos quentes,
vinheta suave, calhas claras, hierarquia tipográfica forte,
espaço reservado para CTA "COMECE SUA AVENTURA"
Pôster Minimalista
Pôster minimalista, título grande ao centro: "SUMMIT DE INOVAÇÃO", subtítulo pequeno
abaixo: "Março 2026 • São Francisco", objeto focal único: escultura geométrica abstrata,
monocromático + destaque #3CA2F6, fundo de alta legibilidade,
layout baseado em grade
Tira em Quadrinhos
Layout de tira em quadrinhos de 4 painéis, espaços reservados para balões de fala.
Painel 1: desenvolvedor olha fixo para a tela; Painel 2: IA gera solução;
Painel 3: desenvolvedor comemora; Painel 4: "Era tão simples assim?"
Arte em traço grosso, sombreamento plano, calhas claras, alta legibilidade
Exemplo de API: Texto para Imagem
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4",
{"prompt": "Pôster em grade 2x2, título: 'EXPO TECH 2026', quatro conceitos de produtos futuristas, margens limpas, iluminação cinematográfica, cor da marca azul"},
)
print(output["outputs"][0])
Edição de Imagens (V4 Edit)
A variante de edição modifica imagens existentes preservando a identidade do assunto, iluminação e composição. Use prompts claros e estruturados seguindo o padrão: ação + objeto + característica alvo + restrições.
Troca de Roupa
Troca de roupa para retrato, substituir vestimenta por elegante blazer azul-marinho;
manter pose e composição; acessórios: relógio dourado;
maquiagem/cabelo sem alteração; preservar tom de pele e iluminação;
bordas limpas, sem artefatos
Substituição de Fundo
Substituição de fundo para o sujeito, manter bordas do sujeito;
novo ambiente: escritório moderno com janelas do chão ao teto;
corresponder direção e temperatura de cor da luz;
sombras de contato suaves; sem halo
Redesign de Interior
Troca de acabamento interior, atualizar parede para tijolo aparente,
piso para madeira escura, estofamento de móveis para linho carvão;
layout e iluminação sem alteração; texturas PBR realistas
Exemplo de API: Edição de Imagens
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Substituir o fundo por uma praia tropical ao pôr do sol, corresponder direção da luz, sombras suaves",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
Geração Sequencial (V4 Sequential)
A variante sequencial gera múltiplas imagens em uma única chamada com estilo, identidade e paleta consistentes em todo o conjunto. Você deve especificar o número de imagens tanto no prompt quanto no parâmetro max_images.
Folha de Design de Personagem
Gerar 6 folhas de personagem de um hacker cyberpunk.
Imagem 1: pose neutra; Imagem 2: pose de ação; Imagem 3: perfil lateral;
Imagem 4: vista traseira; Imagem 5: expressão feliz; Imagem 6: expressão séria.
Mesma roupa e paleta, estilo de turnaround limpo.
Campanha Publicitária
Gerar 4 conceitos de pôster da mesma campanha de marca de café.
Imagem 1: manchete "ACORDE", luz matinal;
Imagem 2: manchete "RECARREGUE", energia da tarde;
Imagem 3: manchete "DESACELERE", calor da noite;
Imagem 4: manchete "SONHE ALTO", ambiente noturno.
Manter cor da marca marrom/dourado, grade e margens consistentes, iluminação cinematográfica.
Exemplo de API: Geração Sequencial
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Gerar 4 imagens de um tênis em diferentes combinações de cores. Imagem 1: branco/azul; Imagem 2: preto/dourado; Imagem 3: vermelho/branco; Imagem 4: verde/creme. Iluminação de estúdio, ângulo e composição idênticos, fundo limpo.",
"max_images": 4,
},
)
for url in output["outputs"]:
print(url)
Nota sobre custo: O modelo sequencial cobra por
max_images, não pela saída real. Se você definirmax_images=4mas descrever apenas 2 imagens no seu prompt, ainda será cobrado por 4. Sempre corresponda o número no seu prompt aomax_images.
Seedream 4.5: Tipografia e Edição Profunda
O Seedream 4.5 aprimora o 4.0 com melhorias significativas em renderização de texto, aderência ao prompt, qualidade estética e consistência de imagens de referência. É a escolha recomendada para qualquer trabalho envolvendo tipografia, visuais de marca ou edição de retratos.
Principais Melhorias em Relação ao 4.0
- Tipografia aprimorada: Texto nítido e legível para pôsteres, logotipos, UI e layouts de marketing
- Composição em nível de designer: Lida com layouts complexos no estilo de pôsteres com hierarquia clara
- Maior aderência ao prompt: Segue de perto descrições detalhadas de assuntos, layout e estilo
- Resolução mais alta: Suporta 2560x1440 até 4096x4096 (mínimo maior que o V4)
- Melhor consistência de referência: Preserva características faciais, iluminação e tom de cor de imagens de referência
Variantes do Modelo
Assim como o V4, o Seedream 4.5 oferece quatro variantes no WaveSpeedAI:
| Variante | Caminho do Modelo | Tipo | Caso de Uso |
|---|---|---|---|
| Base | bytedance/seedream-v4.5 | Texto para Imagem | Pôsteres com muita tipografia, visuais de marca |
| Edit | bytedance/seedream-v4.5/edit | Imagem para Imagem | Edição de retratos, retoque de produtos |
| Sequential | bytedance/seedream-v4.5/sequential | Lote T2I | Séries consistentes, conjuntos de campanhas |
| Edit-Sequential | bytedance/seedream-v4.5/edit-sequential | Lote I2I | Fusão de múltiplas imagens, transferências de estilo |
Resoluções Recomendadas (V4.5)
| Proporção de Aspecto | Resolução Sugerida |
|---|---|
| 1:1 | 2048x2048 |
| 4:3 | 2688x2016 |
| 3:2 | 2688x1792 |
| 16:9 | 2560x1440 |
| Quadrado 4K | 4096x4096 |
Melhores Práticas de Renderização de Texto
O destaque do Seedream 4.5 é a geração precisa de texto dentro das imagens. Siga estas diretrizes para melhores resultados:
- Use aspas duplas ao redor do texto que deve aparecer na imagem:
Gerar um pôster com o título "Seedream 4.5" - Especifique as características da fonte: “negrito sem serifa”, “script elegante”, “manuscrito”
- Descreva o posicionamento do texto: “título centralizado no topo”, “subtítulo abaixo”, “CTA inferior direito”
- Mantenha o texto curto: 1–10 palavras funcionam melhor; parágrafos longos podem ter inconsistências
- Use resoluções mais altas: 2048x2048 ou acima oferece tipografia notavelmente mais limpa
Exemplo: Pôster de Marca
Pôster minimalista para conferência de tecnologia, fundo azul-marinho escuro.
Grande título branco em caixa alta no topo: "AI SUMMIT 2026".
Pequeno subtítulo cinza abaixo: "São Francisco • 15-17 de junho".
Forma geométrica holográfica abstrata centralizada.
Destaque de cor da marca #3CA2F6. Layout de grade limpo, generoso espaço em branco.
Exemplo de API: Geração com Muita Tipografia
import wavespeed
output = wavespeed.run(
"bytedance/seedream-v4.5",
{
"prompt": "Quadro de menu de cafeteria, estilo lousa, título 'ESPECIAIS DO DIA' em letras de giz em negrito, itens: Espresso R$15, Latte R$20, Cappuccino R$22, iluminação ambiente quente, atmosfera aconchegante de café",
"size": "2048x2048",
},
)
print(output["outputs"][0])
Geração Baseada em Referência (V4.5 Edit)
O Seedream 4.5 Edit destaca-se em extrair e preservar características visuais de imagens de referência:
Transferência de Gradação de Cor
Alterar o tom de cor da Imagem 1 para corresponder ao tom de cor da Imagem 2
Transferência de Maquiagem
Transferir a maquiagem da Imagem 2 para a pessoa na Imagem 1
Aplicação de Estilo de Marca
Aplicar o estilo de design de marca da Imagem 1 ao produto na Imagem 2,
criar uma imagem promocional de série de marca similar,
incluir todos os módulos de design da Imagem 1
Seedream 5.0-Preview: Inteligência e Raciocínio
O Seedream 5.0-Preview introduz capacidades que vão além da geração tradicional de imagens. Prioriza conhecimento e inteligência em detrimento da estética pura, adicionando pesquisa web em tempo real, controle preciso de edição e raciocínio lógico avançado.
Nota: Para beleza visual pura e fotorrealismo, o Seedream 4.5 continua sendo a escolha recomendada. O lançamento completo do 5.0 combinará inteligência e estética.
Pesquisa Web em Tempo Real
O 5.0-Preview é o primeiro modelo de geração de imagens a suportar geração baseada em pesquisa. O modelo determina inteligentemente quando pesquisar com base no seu prompt:
- Termos sensíveis ao tempo: Lançamentos recentes de produtos, eventos atuais
- Entidades específicas: Celebridades, marcas, locais
- Consultas de cauda longa: Tópicos de nicho que exigem precisão factual
Exemplos de prompts que acionam a pesquisa:
Gerar conceito de design do iPhone 17 Pro Max
Referenciar a interface do aplicativo Duolingo, projetar uma
página de cartão de vocabulário com palavra e contador de sequência, incorporar
a mascote coruja verde
Gerar pôster das Olimpíadas de Inverno Nórdico: fundo de aurora norueguesa,
esquiador em uniforme nacional, incluir
elementos olímpicos e mascote
Raciocínio Lógico Inteligente
O 5.0-Preview lida com operações complexas que requerem compreensão de contexto e tomada de decisão em múltiplas etapas:
Classificação e Distribuição
Classificar as flores na Imagem 1 por variedade, organizá-las
separadamente nos três vasos mostrados na Imagem 2
Compreensão do Mundo Físico
Duas réguas de papelaria, a de cima é uma régua de plástico de 20cm,
a de baixo é uma régua de aço de 10cm
Raciocínio 3D
Gerar a forma 3D montada com base no
diagrama de layout plano da embalagem
Conhecimento Específico de Domínio
Referenciar este conjunto de desenhos CAD, gerar uma visualização
realista do edifício
Diagrama de vista anterior do sistema respiratório humano mostrando:
cavidade nasal, narinas, cavidade oral, faringe, laringe,
traqueia, brônquios principais esquerdo e direito, pulmões esquerdo e direito,
e diafragma
Edição Baseada em Exemplos
Em vez de descrever transformações complexas, mostre ao modelo o que você deseja com exemplos de antes/depois:
Referenciar a mudança da Imagem 1 para a Imagem 2, aplicar a
mesma operação na Imagem 3
Isso funciona para mudanças de penteado, trocas de cena, transformações de material e mudanças de perspectiva.
Guia de Engenharia de Prompts
Estas dicas se aplicam a todas as versões Seedream 4.0–5.0.
Use Linguagem Natural, Não Listas de Tags
Escreva narrativas coerentes em vez de listas fragmentadas de palavras-chave:
Evite:
menina, vestido luxuoso, sombrinha, alameda arborizada, pintura a óleo, estilo Monet
Prefira:
Uma menina em um vestido luxuoso caminhando sob uma sombrinha ao longo de uma alameda arborizada,
no estilo de uma pintura a óleo de Monet
Fórmula de Estrutura de Prompt
[Assunto] + [Ação/Pose] + [Ambiente/Cenário] + [Estilo] + [Detalhes Técnicos] + [Conteúdo de Texto]
Exemplo:
Um barista profissional (assunto) criando arte latte (ação) em uma moderna
cafeteria especializada (ambiente), estilo fotorrealista (estilo),
luz matinal quente através de grandes janelas, profundidade de campo rasa (técnico),
uma lousa atrás deles lendo "TORREFADORES ARTESANAIS" (conteúdo de texto)
Prompts de Edição
Para edição de imagens, use instruções específicas e inequívocas que declarem explicitamente o que muda e o que permanece igual:
Evite: Deixe melhor
Prefira: Substituir o céu encoberto por um cenário de pôr do sol vívido, tons alaranjados quentes; manter o edifício e o primeiro plano sem alterações
Marcação Visual para Edições Complexas
Quando as descrições de texto sozinhas não são suficientes para posicionamento preciso, use setas, caixas delimitadoras ou rabiscos na imagem de referência para designar regiões específicas para modificação.
Erros Comuns
- Instruções conflitantes: “Personagem de desenho animado fotorrealista” — escolha uma direção de estilo
- Prompts excessivamente complicados: Comece simples, adicione detalhes incrementalmente
- Ignorar a proporção de aspecto: Combine dimensões ao seu caso de uso (quadrado para redes sociais, paisagem para banners)
- Instruções de edição vagas: Evite pronomes como “mude isso” — especifique o que é “isso”
Escolhendo a Versão Correta
Guia de Decisão Rápida
- Precisa de velocidade e baixo custo? → Seedream 4.0
- Precisa de texto nítido nas imagens? → Seedream 4.5
- Precisa de pôsteres com qualidade de marca? → Seedream 4.5
- Precisa de conjuntos consistentes de múltiplas imagens? → V4 ou V4.5 Sequential
- Precisa editar fotos existentes? → V4 ou V4.5 Edit
- Precisa de imagens de eventos atuais? → Seedream 5.0-Preview
- Precisa de conteúdo baseado em conhecimento? → Seedream 5.0-Preview
Comparação Detalhada
| Capacidade | 4.0 | 4.5 | 5.0-Preview |
|---|---|---|---|
| Texto para Imagem | Sim | Sim | Sim |
| Edição de Imagens | Sim | Sim (melhor) | Sim |
| Múltiplas Imagens | Sim | Sim | Sim |
| Geração Sequencial | Sim | Sim | Sim |
| Renderização de Texto | Boa | Excelente | Boa |
| Pesquisa Web | Não | Não | Sim |
| Raciocínio Lógico | Básico | Básico | Avançado |
| Resolução Máxima | 4096x4096 | 4096x4096 | 4K |
| Resolução Mínima | ~320x320 | 2560x1440 | — |
| Velocidade | Mais rápida | Moderada | Moderada |
| Custo | $0,027 | $0,04 | — |
Limitações das Versões
Seedream 4.0: Textos pequenos podem se repetir ou degradar; precisão de edição menor que o 4.5.
Seedream 4.5: Ocasionais problemas de desfoque ou corte; custo e tempo de geração maiores que o 4.0.
Seedream 5.0-Preview: Aparência ocasionalmente gerada por IA; problemas ocasionais de proporção; instabilidade de estrutura de texto; raciocínio limitado sobre gráficos/dados. Atualmente prioriza inteligência sobre estética.
Todos os Modelos Disponíveis no WaveSpeedAI
| Modelo | Tipo | Preço | Ideal Para |
|---|---|---|---|
bytedance/seedream-v4 | Texto para Imagem | $0,027 | Pôsteres, layouts em grade, designs conceituais |
bytedance/seedream-v4/edit | Imagem para Imagem | $0,027 | Trocas de roupa, mudanças de fundo, retoque |
bytedance/seedream-v4/sequential | Lote T2I | $0,027/imagem | Folhas de personagens, conjuntos de campanhas |
bytedance/seedream-v4/edit-sequential | Lote I2I | $0,027/imagem | Fusão de múltiplas imagens, variantes A/B |
bytedance/seedream-v4.5 | Texto para Imagem | $0,04 | Tipografia, visuais de marca, pôsteres 4K |
bytedance/seedream-v4.5/edit | Imagem para Imagem | $0,04 | Edição de retratos, transferência de estilo/característica |
bytedance/seedream-v4.5/sequential | Lote T2I | $0,04/imagem | Séries de marca, campanhas consistentes |
bytedance/seedream-v4.5/edit-sequential | Lote I2I | $0,04/imagem | Edição de múltiplas imagens, exploração de design |
bytedance/seedream-v5.0-lite | Texto para Imagem | $0,035 | Geração baseada em conhecimento, pesquisa web |
bytedance/seedream-v5.0-lite/edit | Imagem para Imagem | $0,035 | Edição inteligente, transferência de característica |
bytedance/seedream-v5.0-lite/sequential | Lote T2I | $0,035/imagem | Séries inteligentes consistentes |
bytedance/seedream-v5.0-lite/edit-sequential | Lote I2I | $0,035/imagem | Edição inteligente de múltiplas imagens |
Primeiros Passos
- Cadastre-se no WaveSpeedAI e obtenha sua chave de API
- Instale o SDK:
pip install wavespeed - Escolha seu modelo com base no guia de decisão acima
- Escreva seu prompt usando a fórmula de estrutura e as melhores práticas
- Gere e itere: Refine os prompts com base nos resultados
import wavespeed
# Texto para Imagem com Seedream 4.5
output = wavespeed.run(
"bytedance/seedream-v4.5",
{"prompt": "Um pôster elegante de apresentação de produto, título 'PRÓXIMA GERAÇÃO' em negrito sans-serif branco, fundo com gradiente escuro, smartphone flutuante com tela holográfica, iluminação cinematográfica, cor da marca #3CA2F6"},
)
print(output["outputs"][0])
import wavespeed
# Edição de Imagens com Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/edit",
{
"prompt": "Mudar a roupa para um terno preto formal, manter a mesma pose e iluminação do fundo",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
import wavespeed
# Geração Sequencial com Seedream 4.0
output = wavespeed.run(
"bytedance/seedream-v4/sequential",
{
"prompt": "Gerar 3 visuais tutoriais passo a passo para fazer café pour-over. Imagem 1: moendo os grãos; Imagem 2: despejando água em movimento circular; Imagem 3: xícara finalizada com vapor. Estilo quente uniforme, rótulos numerados.",
"max_images": 3,
},
)
for url in output["outputs"]:
print(url)
Seja para construir automação de marketing, criar conteúdo para redes sociais em escala ou desenvolver aplicações criativas, a família Seedream 4.0–5.0 no WaveSpeedAI oferece o espectro completo, desde iteração rápida até geração inteligente e baseada em conhecimento.





