Template de Prompt para Seedance 2.0: Framework de Copiar e Colar para Movimento + Câmera + Estilo
Um framework prático de prompts para o Seedance 2.0 com linguagem de cena, restrições de movimento, negativos e 5 templates comprovados.
Quer criar vídeos cinematográficos como o Seedance 2.0? Experimente o WaveSpeed Cinematic Video Generator para criar vídeos cinematográficos no nível do Seedance 2.0 agora mesmo.
Olá, sou a Dora. Uma coisa pequena me empurrou para isso: eu continuava chegando quase lá. As imagens ficavam próximas do que eu queria, mas mudavam de clima na terceira tomada. Eu não precisava de mais recursos. Precisava de uma forma mais consistente de me comunicar com o modelo. Então, ao longo de algumas sessões entre janeiro e fevereiro de 2026, desenvolvi um template de prompt para o Seedance 2.0 que eu podia reutilizar sem precisar monitorar cada geração.
Anatomia do prompt que reduz a deriva (sujeito → ação → câmera → estilo → restrições)
O maior ganho veio de estabelecer uma ordem rígida e segui-la. Quando eu escrevia prompts como uma frase, o Seedance 2.0 se saía bem no primeiro momento, depois divagava. Quando eu os escrevia como um cartão de preenchimento, a deriva diminuía.
Aqui está a estrutura de cinco partes que uso agora:
- Sujeito: Quem ou o quê é o foco da cena, singular sempre que possível.
- Ação: O que o sujeito está fazendo, em linguagem simples.
- Câmera: Como vemos a cena — tamanho do plano + movimento + indicação de lente, se necessário.
- Estilo: A aparência, não uma lista de sensações. Uma referência âncora vale mais do que seis adjetivos.
- Restrições: O que manter fixo, o que excluir e o tempo.
Por que essa ordem funciona na prática:
- Sujeito primeiro ancora o modelo em um centro de gravidade. Se eu mencionar vários sujeitos logo de início, o modelo divide a atenção mais tarde.
- Ação em seguida é a âncora cinética. Ela diz ao modelo o que deve se mover mesmo que o estilo mude.
- Câmera depois define a lógica de enquadramento, para que o modelo não “redecida” a lente a cada poucos segundos.
- Estilo no final da estrutura adiciona sabor sem sequestrar a ação.
- Restrições por último funcionam como trilhos — especialmente para cor, iluminação e mãos/rostos.
Um template compacto do Seedance 2.0 que copio a cada vez:
Sujeito: [uma pessoa/objeto, idade ou material se relevante]
Ação: [frase verbal específica, tempo presente]
Câmera: [tamanho do plano] + [movimento] + [ângulo], [distância focal aproximada ou “grande angular/normal/teleobjetiva”]
Estilo: [uma referência visual âncora: filme/processo/artista], [iluminação], [tratamento de cor]
Restrições: [lista de proibições], [taxa de quadros/ritmo], [duração ou temporização de batidas], [notas de consistência]
Um exemplo que manteve a forma em três cortes:
- Sujeito: caneca de cerâmica dos anos 30 sobre uma bancada, branco fosco
- Ação: vapor sobe enquanto uma mão desliza a caneca para o quadro e faz uma pausa
- Câmera: plano médio fechado, dolly lento de aproximação, ao nível dos olhos, lente normal
- Estilo: luz suave de janela matinal, leve grão de filme, paleta apagada
- Restrições: sem logos, sem sobreposição de texto, sem zoom brusco, manter a mão firme por 2s
O que mudou para mim: menos reenquadramentos surpresa. Antes, eu pedia “aconchegante, câmera na mão, luz da manhã” e recebia um avanço de câmera na primeira tomada, uma panorâmica instável na segunda. O template manteve o comportamento da lente estável sem que eu precisasse microgerenciar.
Vocabulário de movimento e câmera que realmente muda os resultados
Parei de usar palavras de humor como palavras de câmera. “Dinâmico” não significa nada para uma lente. Indicações específicas de movimento, sim. Quando troquei prompts vagos por prompts concretos, o movimento do Seedance 2.0 ficou mais intencional.
Isso está alinhado com a forma como a semântica de movimento e câmera é descrita na visão geral técnica pública do Seedance 2.0, onde o movimento de câmera é tratado como um sinal de condicionamento de primeira classe, e não como um detalhe de estilo secundário.
O que funcionou bem nos testes:
- Palavras de movimento ligadas a metáforas de equipamento: dolly, track, grua, câmera na mão, gimbal. “Câmera na mão” adicionou micro-tremor; “gimbal” manteve suave.
- Velocidade como escalar: lento, médio, rápido, combinado com distância (“dolly lento de aproximação, 30–60 cm”). Mesmo números aproximados ajudaram.
- Tamanho do plano no início: grande angular / médio / fechado trava a composição. O modelo para de recentralizar rostos no meio da tomada.
- Ângulo com propósito: ao nível dos olhos para neutro, ângulo baixo para presença, ângulo alto para vulnerabilidade ou visão geral.
- Indicações de lente em categorias: grande angular (sensação de 24–28mm), normal (sensação de 35–50mm), teleobjetiva (sensação de 85mm+). Evito milímetros exatos a menos que seja necessário.
Também descobri que combinar dois verbos de movimento fazia o modelo escolher o caos. Um verbo por tomada mantinha as coisas limpas. Quando precisava de um movimento composto (por exemplo, panorâmica + dolly), eu o escrevi em batidas: “Início: dolly lento de aproximação. Depois: panorâmica suave para a direita nos últimos 2 segundos.” O Seedance respeitou a sequência melhor do que se eu tivesse colocado os dois em uma única cláusula.
Guia rápido de planos (grande angular/médio/fechado, panorâmica/dolly/câmera na mão)
- Grande angular: estabelece espaço e contexto. Ótimo para produto no ambiente ou cenas em equipe. Combine com dolly lento ou plano fixo. Evite panorâmicas rápidas a menos que queira borramento.
- Médio: sujeito + algum contexto. Seguro para diálogo e UGC. Câmera na mão aqui parece pessoal; gimbal parece polido.
- Fechado: detalhe e emoção. Funciona com pequenos avanços; panorâmicas parecem abruptas. Indicações de teleobjetiva aqui ajudam a manter o fundo desfocado.
- Panorâmica: rotação lateral. Use para revelar informação adjacente. Mantenha lento: amplifica o borramento de movimento.
- Dolly/Track: movimento físico em direção a/de/ao lado do sujeito. Parece cinematográfico mesmo em baixa velocidade. Meu padrão para fotos de produto.
- Câmera na mão: leve balançar e micro-tremor. Ótimo para UGC, arriscado para sobreposições de texto.
Mantenho essa lista perto da janela de prompt. Ela me lembra de escolher um movimento claro em vez de um parágrafo de clima.
Lista de verificação de prompt negativo (o que proibir explicitamente)
As proibições pareciam excessivas no início, mas pouparam refilmagens. Estes foram os reincidentes nas minhas execuções:
- Ruído visual: sem sobreposição de texto, sem marcas d’água, sem UI flutuante, sem flares de lente a menos que especificado
- Deriva de identidade: sem personagens extras, sem multidão, sem espelhos refletindo outras pessoas
- Caos de câmera: sem zoom brusco, sem panorâmica rápida, sem ângulos holandeses, sem cortes bruscos
- Artefatos corporais: sem dedos extras, sem mãos deformadas, sem canecas/alças distorcidas, sem bordas derretendo
- Marca: sem logos, sem etiquetas, sem marcas reconhecíveis
- Cor/gradação: sem iluminação neon, sem predominância de verde-azulado/laranja, sem saturação de cartoon
- Ambiente: sem chuva/neblina/fumaça a menos que declarado, sem confete, sem partículas de poeira
- Áudio/texto: se você vai adicionar narração em pós-produção, proíba legendas automáticas
Não uso todas essas a cada vez. Escolho 3–5 que importam para a cena. Muitas negativas podem embotar a imagem. Se os artefatos persistirem após duas tentativas, mudo de estratégia: ajusto o texto do sujeito ou simplifico a nota de câmera em vez de acumular mais proibições.
5 templates para copiar e colar (UGC, anúncio de produto, cinematográfico, talking head, montagem)
Estes não são mágicos: são pontos de partida. Eu colo um, preencho os colchetes e reservo o resto do meu raciocínio para o timing e a música.
- UGC (sensação de celular na mão)
Sujeito: [pessoa, faixa etária, ambiente]
Ação: [fala casualmente sobre X enquanto faz Y]
Câmera: Médio, perspectiva de celular na mão, leve balançar, ao nível dos olhos, sensação de lente normal
Estilo: Luz interna natural, aparência sem gradação, leve borramento de movimento
Restrições: Sem legendas, sem zoom brusco, manter mãos naturais, 8–10s, manter fundo simples
- Anúncio de produto (limpo e estável)
Sujeito: [nome/material/cor do produto]
Ação: [gira lentamente / desliza para o quadro / movimento hero sutil]
Câmera: Plano fechado a médio fechado, dolly lento de aproximação, horizonte travado, sensação de normal a teleobjetiva
Estilo: Luz principal suave + contraluz leve, gradação de cor neutra, leve grão de filme
Restrições: Sem logos/etiquetas, sem flares, segurar quadro final por 2s, 6–8s no total
- Cinematográfico (clima em primeiro lugar sem perder o controle)
Sujeito: [personagem ou lugar]
Ação: [batida específica, espera, vira, respira, entra na luz]
Câmera: Grande angular de estabelecimento por 2s depois avanço lento para médio, suave de gimbal, ao nível dos olhos
Estilo: [referência âncora única, ex.: “luz natural nublada, azuis apagados”]
Restrições: Sem ângulos holandeses, sem multidão, sem neon, manter aparência nublada, 10–12s
- Talking head (estável e legível)
Sujeito: [descrição do apresentador]
Ação: [entrega uma linha clara]
Câmera: Médio fechado, tripé travado ou dolly de aproximação muito sutil, ao nível dos olhos
Estilo: Luz principal suave a 45°, boa separação de fundo, gradação neutra
Restrições: Sem legendas automáticas, sem panorâmicas rápidas, tons de pele naturais, 12–15s, manter linha de olhar centralizada
- Montagem (batidas rápidas sem caos)
Sujeito: [tema, ex.: “ritual do café da manhã”]
Ação: Batida 1 [contexto grande angular], Batida 2 [mãos em close], Batida 3 [detalhe de vapor], Batida 4 [gole]
Câmera: Cada batida 2s, tamanho de plano claro por batida, sem movimentos compostos: transições por corte
Estilo: Luz e paleta consistentes em todas as batidas
Restrições: Sem sobreposição de texto, sem aceleração de velocidade, manter ritmo constante, 8–10s no total
Uma pequena observação dos testes: quando quero uma borda de produto nítida, troco “câmera na mão” por “dolly” mesmo no UGC. Fica um pouco menos autêntico, mas fica mais limpo para sobreposições depois.
Se você quiser reforçar o vocabulário, o guia de tamanhos de plano da StudioBinder é bem útil, e a visão geral de movimentos de câmera deles se mapeia bem para como os modelos interpretam palavras de movimento.
Regras de decisão — quando reeditar o prompt vs. mudar a referência
Quando uma execução falha, tento não me desesperar. Uso esta pequena árvore de decisão:
- Se o enquadramento está errado mas a ação está certa: reedite o prompt. Refine a Câmera primeiro (tamanho do plano + um movimento). Mantenha Sujeito e Ação idênticos.
- Se o movimento parece errado (muito instável/rápido): reedite o prompt. Troque “câmera na mão” ↔ “gimbal” e defina uma velocidade. Não mexa no Estilo ainda.
- Se o estilo ou cor deriva enquanto movimento e enquadramento estão bons: reedite o prompt. Substitua a linha de Estilo por uma âncora única e mais forte e remova adjetivos extras.
- Se o sujeito continua mutando (pessoas extras, props mudando) após dois reedites: mude a referência. Simplifique o Sujeito. Menos descritores, um substantivo.
- Se artefatos se repetem (mãos, logos, flares estranhos) após três tentativas: mude as restrições ou o plano de tomada. Às vezes um plano fechado está lutando contra o modelo; recue para um médio.
Em termos de tempo: me dou dois reedites rápidos (menos de 5 minutos no total). Se ainda estou ajustando o mesmo erro, mudo a linha de referência ou a escolha de tomada. Isso me impediu de gastar uma hora refinando uma ideia ruim.
Por que isso importa: o modelo tende a honrar a instrução forte mais inicial. Se ela estiver errada, editar as linhas subsequentes não vai resolver.
Uma última observação de campo: prompts mais curtos com essa estrutura superam os longos e poéticos por uma grande margem. Minhas melhores tomadas tinham menos de 60 palavras mais restrições.
Quer criar vídeos cinematográficos como o Seedance 2.0? Experimente o WaveSpeed Cinematic Video Generator para criar vídeos cinematográficos no nível do Seedance 2.0 agora mesmo.





