Template de Prompt para Seedance 2.0: Framework de Copiar e Colar para Movimento + Câmera + Estilo

Quer criar vídeos cinematográficos como o Seedance 2.0? Experimente o WaveSpeed Cinematic Video Generator para criar vídeos cinematográficos no nível do Seedance 2.0 agora mesmo.

Olá, sou a Dora. Uma coisa pequena me empurrou para isso: eu continuava chegando quase lá. As imagens ficavam próximas do que eu queria, mas mudavam de clima na terceira tomada. Eu não precisava de mais recursos. Precisava de uma forma mais consistente de me comunicar com o modelo. Então, ao longo de algumas sessões entre janeiro e fevereiro de 2026, desenvolvi um template de prompt para o Seedance 2.0 que eu podia reutilizar sem precisar monitorar cada geração.

Anatomia do prompt que reduz a deriva (sujeito → ação → câmera → estilo → restrições)

O maior ganho veio de estabelecer uma ordem rígida e segui-la. Quando eu escrevia prompts como uma frase, o Seedance 2.0 se saía bem no primeiro momento, depois divagava. Quando eu os escrevia como um cartão de preenchimento, a deriva diminuía.

Aqui está a estrutura de cinco partes que uso agora:

Sujeito: Quem ou o quê é o foco da cena, singular sempre que possível.
Ação: O que o sujeito está fazendo, em linguagem simples.
Câmera: Como vemos a cena — tamanho do plano + movimento + indicação de lente, se necessário.
Estilo: A aparência, não uma lista de sensações. Uma referência âncora vale mais do que seis adjetivos.
Restrições: O que manter fixo, o que excluir e o tempo.

Por que essa ordem funciona na prática:

Sujeito primeiro ancora o modelo em um centro de gravidade. Se eu mencionar vários sujeitos logo de início, o modelo divide a atenção mais tarde.
Ação em seguida é a âncora cinética. Ela diz ao modelo o que deve se mover mesmo que o estilo mude.
Câmera depois define a lógica de enquadramento, para que o modelo não “redecida” a lente a cada poucos segundos.
Estilo no final da estrutura adiciona sabor sem sequestrar a ação.
Restrições por último funcionam como trilhos — especialmente para cor, iluminação e mãos/rostos.

Um template compacto do Seedance 2.0 que copio a cada vez:

Sujeito: [uma pessoa/objeto, idade ou material se relevante]

Ação: [frase verbal específica, tempo presente]

Câmera: [tamanho do plano] + [movimento] + [ângulo], [distância focal aproximada ou “grande angular/normal/teleobjetiva”]

Estilo: [uma referência visual âncora: filme/processo/artista], [iluminação], [tratamento de cor]

Restrições: [lista de proibições], [taxa de quadros/ritmo], [duração ou temporização de batidas], [notas de consistência]

Um exemplo que manteve a forma em três cortes:

Sujeito: caneca de cerâmica dos anos 30 sobre uma bancada, branco fosco
Ação: vapor sobe enquanto uma mão desliza a caneca para o quadro e faz uma pausa
Câmera: plano médio fechado, dolly lento de aproximação, ao nível dos olhos, lente normal
Estilo: luz suave de janela matinal, leve grão de filme, paleta apagada
Restrições: sem logos, sem sobreposição de texto, sem zoom brusco, manter a mão firme por 2s

O que mudou para mim: menos reenquadramentos surpresa. Antes, eu pedia “aconchegante, câmera na mão, luz da manhã” e recebia um avanço de câmera na primeira tomada, uma panorâmica instável na segunda. O template manteve o comportamento da lente estável sem que eu precisasse microgerenciar.

Vocabulário de movimento e câmera que realmente muda os resultados

Parei de usar palavras de humor como palavras de câmera. “Dinâmico” não significa nada para uma lente. Indicações específicas de movimento, sim. Quando troquei prompts vagos por prompts concretos, o movimento do Seedance 2.0 ficou mais intencional.

Isso está alinhado com a forma como a semântica de movimento e câmera é descrita na visão geral técnica pública do Seedance 2.0, onde o movimento de câmera é tratado como um sinal de condicionamento de primeira classe, e não como um detalhe de estilo secundário.

O que funcionou bem nos testes:

Palavras de movimento ligadas a metáforas de equipamento: dolly, track, grua, câmera na mão, gimbal. “Câmera na mão” adicionou micro-tremor; “gimbal” manteve suave.
Velocidade como escalar: lento, médio, rápido, combinado com distância (“dolly lento de aproximação, 30–60 cm”). Mesmo números aproximados ajudaram.
Tamanho do plano no início: grande angular / médio / fechado trava a composição. O modelo para de recentralizar rostos no meio da tomada.
Ângulo com propósito: ao nível dos olhos para neutro, ângulo baixo para presença, ângulo alto para vulnerabilidade ou visão geral.
Indicações de lente em categorias: grande angular (sensação de 24–28mm), normal (sensação de 35–50mm), teleobjetiva (sensação de 85mm+). Evito milímetros exatos a menos que seja necessário.

Também descobri que combinar dois verbos de movimento fazia o modelo escolher o caos. Um verbo por tomada mantinha as coisas limpas. Quando precisava de um movimento composto (por exemplo, panorâmica + dolly), eu o escrevi em batidas: “Início: dolly lento de aproximação. Depois: panorâmica suave para a direita nos últimos 2 segundos.” O Seedance respeitou a sequência melhor do que se eu tivesse colocado os dois em uma única cláusula.

Guia rápido de planos (grande angular/médio/fechado, panorâmica/dolly/câmera na mão)

Grande angular: estabelece espaço e contexto. Ótimo para produto no ambiente ou cenas em equipe. Combine com dolly lento ou plano fixo. Evite panorâmicas rápidas a menos que queira borramento.
Médio: sujeito + algum contexto. Seguro para diálogo e UGC. Câmera na mão aqui parece pessoal; gimbal parece polido.
Fechado: detalhe e emoção. Funciona com pequenos avanços; panorâmicas parecem abruptas. Indicações de teleobjetiva aqui ajudam a manter o fundo desfocado.
Panorâmica: rotação lateral. Use para revelar informação adjacente. Mantenha lento: amplifica o borramento de movimento.
Dolly/Track: movimento físico em direção a/de/ao lado do sujeito. Parece cinematográfico mesmo em baixa velocidade. Meu padrão para fotos de produto.
Câmera na mão: leve balançar e micro-tremor. Ótimo para UGC, arriscado para sobreposições de texto.

Mantenho essa lista perto da janela de prompt. Ela me lembra de escolher um movimento claro em vez de um parágrafo de clima.

Lista de verificação de prompt negativo (o que proibir explicitamente)

As proibições pareciam excessivas no início, mas pouparam refilmagens. Estes foram os reincidentes nas minhas execuções:

Ruído visual: sem sobreposição de texto, sem marcas d’água, sem UI flutuante, sem flares de lente a menos que especificado
Deriva de identidade: sem personagens extras, sem multidão, sem espelhos refletindo outras pessoas
Caos de câmera: sem zoom brusco, sem panorâmica rápida, sem ângulos holandeses, sem cortes bruscos
Artefatos corporais: sem dedos extras, sem mãos deformadas, sem canecas/alças distorcidas, sem bordas derretendo
Marca: sem logos, sem etiquetas, sem marcas reconhecíveis
Cor/gradação: sem iluminação neon, sem predominância de verde-azulado/laranja, sem saturação de cartoon
Ambiente: sem chuva/neblina/fumaça a menos que declarado, sem confete, sem partículas de poeira
Áudio/texto: se você vai adicionar narração em pós-produção, proíba legendas automáticas

Não uso todas essas a cada vez. Escolho 3–5 que importam para a cena. Muitas negativas podem embotar a imagem. Se os artefatos persistirem após duas tentativas, mudo de estratégia: ajusto o texto do sujeito ou simplifico a nota de câmera em vez de acumular mais proibições.

5 templates para copiar e colar (UGC, anúncio de produto, cinematográfico, talking head, montagem)

Estes não são mágicos: são pontos de partida. Eu colo um, preencho os colchetes e reservo o resto do meu raciocínio para o timing e a música.

UGC (sensação de celular na mão)

Sujeito: [pessoa, faixa etária, ambiente]

Ação: [fala casualmente sobre X enquanto faz Y]

Câmera: Médio, perspectiva de celular na mão, leve balançar, ao nível dos olhos, sensação de lente normal

Estilo: Luz interna natural, aparência sem gradação, leve borramento de movimento

Restrições: Sem legendas, sem zoom brusco, manter mãos naturais, 8–10s, manter fundo simples

Anúncio de produto (limpo e estável)

Sujeito: [nome/material/cor do produto]

Ação: [gira lentamente / desliza para o quadro / movimento hero sutil]

Câmera: Plano fechado a médio fechado, dolly lento de aproximação, horizonte travado, sensação de normal a teleobjetiva

Estilo: Luz principal suave + contraluz leve, gradação de cor neutra, leve grão de filme

Restrições: Sem logos/etiquetas, sem flares, segurar quadro final por 2s, 6–8s no total

Cinematográfico (clima em primeiro lugar sem perder o controle)

Sujeito: [personagem ou lugar]

Ação: [batida específica, espera, vira, respira, entra na luz]

Câmera: Grande angular de estabelecimento por 2s depois avanço lento para médio, suave de gimbal, ao nível dos olhos

Estilo: [referência âncora única, ex.: “luz natural nublada, azuis apagados”]

Restrições: Sem ângulos holandeses, sem multidão, sem neon, manter aparência nublada, 10–12s

Talking head (estável e legível)

Sujeito: [descrição do apresentador]

Ação: [entrega uma linha clara]

Câmera: Médio fechado, tripé travado ou dolly de aproximação muito sutil, ao nível dos olhos

Estilo: Luz principal suave a 45°, boa separação de fundo, gradação neutra

Restrições: Sem legendas automáticas, sem panorâmicas rápidas, tons de pele naturais, 12–15s, manter linha de olhar centralizada

Montagem (batidas rápidas sem caos)

Sujeito: [tema, ex.: “ritual do café da manhã”]

Ação: Batida 1 [contexto grande angular], Batida 2 [mãos em close], Batida 3 [detalhe de vapor], Batida 4 [gole]

Câmera: Cada batida 2s, tamanho de plano claro por batida, sem movimentos compostos: transições por corte

Estilo: Luz e paleta consistentes em todas as batidas

Restrições: Sem sobreposição de texto, sem aceleração de velocidade, manter ritmo constante, 8–10s no total

Uma pequena observação dos testes: quando quero uma borda de produto nítida, troco “câmera na mão” por “dolly” mesmo no UGC. Fica um pouco menos autêntico, mas fica mais limpo para sobreposições depois.

Se você quiser reforçar o vocabulário, o guia de tamanhos de plano da StudioBinder é bem útil, e a visão geral de movimentos de câmera deles se mapeia bem para como os modelos interpretam palavras de movimento.

Regras de decisão — quando reeditar o prompt vs. mudar a referência

Quando uma execução falha, tento não me desesperar. Uso esta pequena árvore de decisão:

Se o enquadramento está errado mas a ação está certa: reedite o prompt. Refine a Câmera primeiro (tamanho do plano + um movimento). Mantenha Sujeito e Ação idênticos.
Se o movimento parece errado (muito instável/rápido): reedite o prompt. Troque “câmera na mão” ↔ “gimbal” e defina uma velocidade. Não mexa no Estilo ainda.
Se o estilo ou cor deriva enquanto movimento e enquadramento estão bons: reedite o prompt. Substitua a linha de Estilo por uma âncora única e mais forte e remova adjetivos extras.
Se o sujeito continua mutando (pessoas extras, props mudando) após dois reedites: mude a referência. Simplifique o Sujeito. Menos descritores, um substantivo.
Se artefatos se repetem (mãos, logos, flares estranhos) após três tentativas: mude as restrições ou o plano de tomada. Às vezes um plano fechado está lutando contra o modelo; recue para um médio.

Em termos de tempo: me dou dois reedites rápidos (menos de 5 minutos no total). Se ainda estou ajustando o mesmo erro, mudo a linha de referência ou a escolha de tomada. Isso me impediu de gastar uma hora refinando uma ideia ruim.

Por que isso importa: o modelo tende a honrar a instrução forte mais inicial. Se ela estiver errada, editar as linhas subsequentes não vai resolver.

Uma última observação de campo: prompts mais curtos com essa estrutura superam os longos e poéticos por uma grande margem. Minhas melhores tomadas tinham menos de 60 palavras mais restrições.

Quer criar vídeos cinematográficos como o Seedance 2.0? Experimente o WaveSpeed Cinematic Video Generator para criar vídeos cinematográficos no nível do Seedance 2.0 agora mesmo.

Anatomia do prompt que reduz a deriva (sujeito → ação → câmera → estilo → restrições)

Vocabulário de movimento e câmera que realmente muda os resultados

Guia rápido de planos (grande angular/médio/fechado, panorâmica/dolly/câmera na mão)

Lista de verificação de prompt negativo (o que proibir explicitamente)

5 templates para copiar e colar (UGC, anúncio de produto, cinematográfico, talking head, montagem)

Regras de decisão — quando reeditar o prompt vs. mudar a referência

Artigos relacionados

Gemini 3.5 Flash Lançado — Um Modelo Flash Agora Lidera o Tier Pro nos Benchmarks de Agentes

Gemini 3.5 Pro Chega no Próximo Mês — O Que o Lançamento do Flash Já Nos Diz

Gemini Omni Flash Lançado: Vídeo Multimodal de 10 Segundos, Marca d'Água SynthID, Edição de Áudio Retida

Vazamento do Arcanine: O Que os Desenvolvedores Não Devem Presumir

Gemini 4.0 no Google I/O 2026: O que está confirmado, o que vem de fontes anônimas e o que os desenvolvedores devem realmente observar

O Que É o OpenAI Glacier-Alpha? O Que Realmente Sabemos