Kling 2.6 Motion Control: Padrões de Prompt que Realmente Movem as Partes Certas
title: “Kling 2.6 Motion Control: Padrões para Movimento Preciso” date: “2026-01-15” author: “WaveSpeedAI” description: “Técnicas práticas para controlar movimento em Kling 2.6 sem ambiguidade—tokens de movimento, padrões para membros, câmera e micro-movimentos.” tags: [“kling”, “motion-control”, “ai-video”, “prompting”]
Alguns dias testando Kling 2.6, continuava batendo no mesmo problema: pedia um aceno de mão e o ombro inteiro se deslocava, ou pedia a câmera para aproximar e o sujeito se inclinava para frente como se tivesse sido puxado por uma corda. Não eram falhas dramáticas, apenas aquele problema de baixo nível “mover a parte errada” que lentamente desgasta a confiança.
Então separei uma tarde, fiz café, e tentei entender o que o modelo realmente ouve quando decide o que mover. O que vem a seguir não é uma avaliação. São as anotações que gostaria de ter no primeiro dia: como empurrei Kling 2.6 para um controle de movimento confiável sem transformar cada prompt em um parágrafo.
Por que “mover a parte errada” acontece
Kling 2.6 é bom em movimento plausível. É menos bom em movimento cirúrgico. Quando pedi para “levantar a mão direita dela”, aprendi que o modelo não apenas analisa as palavras: ele também se apoia em priors aprendidos sobre como corpos geralmente se movem e o que a câmera geralmente faz. Acredite em mim, é quando a diversão realmente começa.
Aqui estão os padrões que continuei vendo:
- Referentes ambíguos: Se há dois atores plausíveis (sujeito e câmera), Kling às vezes atribui movimento à câmera porque mantém as cenas estáveis dessa forma. “Aproximar” pode se tornar o sujeito caminhando para frente.
- Oclusão + simetria: Se a mão direita está parcialmente oculta ou similar à esquerda na postura, ela espelhará ou trocará de lados. Iluminação lateral e enquadramento ajudam mais que palavras aqui.
- Bagunça temporal: Sem batidas ou duração, o movimento se espalha por todo o clipe. É quando você fica com microagitação perpétua ou um sujeito que não consegue ficar parado.
Nenhum disso é um bug. É o modelo se protegendo para parecer realista. O conserto, para mim, foi conversar com Kling como um diretor de movimento fala com uma pequena equipe: quem se move, qual parte, até onde, com que velocidade, e o que fica bloqueado.
Checklist de tokens de movimento
Kling não requer sintaxe especial, mas dar a mim mesmo um pequeno template de “token de movimento” me manteve honesto. Escrevi inline, em linguagem comum, como rótulos dentro do prompt. Aqui está a coisa — fez uma enorme diferença.
Minha estrutura de tokens se parece com isto:
- Ator: quem se move (sujeito, mão esquerda, câmera, luz de fundo). Um ator por token.
- Ação: o verbo, mantido pequeno quando a precisão importa (inclinar, olhar, levantar, girar ligeiramente).
- Lado/parte: membro ou objeto exato (pulso direito, sobrancelha esquerda, dedo indicador, inclinação de câmera).
- Magnitude: pequena, média, grande, ou graus/contagens quando necessário (15°, 2 passos, 3 frames).
- Duração + timing: quando acontece e quanto tempo leva (batida 1–2 seg, manter 1 seg, loop).
- Restrição: o que fica parado (torso bloqueado, câmera bloqueada, rosto neutro).
- Negativo: o que não deve se mover (sem mudança de ombro, sem zoom, cabelo calmo).
Geralmente envolvo estes em colchetes para mantê-los escaneáveis para mim, novamente, para mim, não para Kling:
[ator: mão direita] [ação: aceno] [magnitude: pequena] [duração: 1s] [restrição: ombro bloqueado] [negativo: sem movimento de câmera]
Padrão 1: controle de membros
O problema de membros é o clássico. Queria um aceno de mão sutil sem balanço de corpo inteiro. Minhas primeiras tentativas falharam porque pedi por “um aceno gentil.” Kling ouviu “aceno” e animou toda a cadeia.
O que funcionou melhor:
- Nomeie a menor articulação móvel primeiro. “Pulso direito se mexe, dedos lideram, ombro permanece neutro.”
- Adicione uma contra-restrição. “Torso ancorado à cadeira. Sem balanço de quadril.”
- Dê um tempo. “O aceno ocorre em 0:02–0:03, depois descansa.”
- Mantenha a simetria em xeque. “Mão esquerda fica sobre a mesa, parada.”
Um slice de prompt real que produziu movimento limpo:
“Sujeito senta a uma mesa de madeira. Luz calma. O pulso direito faz um pequeno aceno lateral, com os dedos fazendo a maior parte do movimento. Ombro e cotovelo permanecem estáveis. Este movimento acontece uma vez entre 2–3 segundos, depois a mão retorna ao repouso na mesa. Mão esquerda fica parada. Sem movimento de câmera.”
Quando importa ser preciso, defino uma âncora visual: “Pulso direito repousa ao lado da caneca de café: apenas os dedos se movem.” Âncoras reduzem a incerteza do modelo sobre onde as articulações vivem.
Padrão 2: câmera
Metade dos meus clipes “a parte errada se moveu” eram realmente trocas câmera–sujeito. Pedi um “suave aproximar” e o modelo fez o sujeito se inclinar para frente. Razoável, mas não o que queria.
Como separei os dois:
- Declare um suporte de câmera. “Câmera em tripé, zoom sutil de 5% em 2 segundos.”
- Congele o sujeito. “Sujeito permanece completamente imóvel, apenas respirando.”
- Evite verbos que pareçam ações de corpo. Digo “zoom-in” ou “dolly-in”, não “mover mais perto.”
- Use números. “5% zoom, linear, 2s, enquadrado no centro.”
Um slice de prompt que se comportou:
“Plano travado. A câmera executa um slow, linear de 5% zoom-in de 0–2 segundos. Sujeito não se inclina ou dá um passo. Sem mudança de paralaxe. Fundo permanece fixo.”
Se quero paralaxe (um dolly), chamo: “câmera dolly-in, paralaxe rasa na estante, sujeito travado ao centro do quadro.” Essa única linha evita que o modelo finja o movimento com uma inclinação do sujeito.
Uma nota a mais: Kling 2.6 às vezes adiciona oscilação manual para ‘cinema.’ Se não quer isso, diga: “sem tremor manual, sem microagitação.”
Padrão 3: micro-movimento
Micro-movimento é onde Kling 2.6 me surpreendeu de uma forma boa. Pequenas mudanças constantes tendem a parecer naturais — sacudidas oculares, respiração, movimento de tecido — se você mantiver verbos gentis e durações curtas.
O que funcionou:
- Olhos: “duas pequenas sacudidas de olho esquerda→centro no primeiro segundo, pálpebras suaves, cabeça parada.”
- Respiração: “sutil movimento de peito 4–6 mm em 3 segundos, depois queda, loop uma vez.”
- Tecido/cabelo: “brisa quase imperceptível, pontas de cabelo se movem, raízes estáveis: bainha de jaqueta agita por 0.5s.”
- Adereços: “vapor sai da caneca, fino, intermitente, não turbulento.”
O que não:
- Empilhar muitos micros de uma vez. Vira ruído.
- Usar verbos grandes com alvos micro (“virar cabeça ligeiramente” geralmente vira um aceno completo). Uso “ângulo”, “inclinação”, “acomodação”, “deriva.”
Quando clipes ficavam muito vivos, adicionava um teto: “fundo permanece imóvel: apenas [X] se move.” Essa única linha reduziu oscilações acidentais pelo quadro.
Prompts negativos
Prompts negativos são menos sobre banir artefatos e mais sobre alocar orçamento de movimento. Obtive melhores resultados quando usei negativos para congelar cadeias específicas.
Negativos úteis que usei:
- “Sem envolvimento do ombro.” Força o modelo a localizar o movimento da mão.
- “Sem movimento de câmera de qualquer tipo.” Mata a oscilação padrão.
- “Cabelo permanece calmo.” Evita que o modelo “cinematize” cenas com vento.
- “Sem mudança de expressão facial.” Mantém micro-movimentos de se transformarem em sorrisos.
- “Sem zoom ou dolly.” Evita a troca sujeito/câmera.
E uma pequena cautela: listas longas de negativos podem sair pela culatra. Dois ou três negativos direcionados batem uma lista inteira.
Para consistência durante o teste desses prompts, executamos nossos experimentos Kling em WaveSpeed (nosso ambiente interno de GPU) para iterar e comparar execuções sem desvio de configuração.

10 prompts prontos
Estes são iniciadores curtos e funcionais que usei. Ajuste sujeitos e estilos, mas mantenha as partes de movimento intactas.
1. Aceno de pulso limpo, torso quieto
“Uma pessoa sentada a uma mesa de madeira, luz do dia.
[ator: pulso direito] [ação: pequeno aceno lateral] [magnitude: pequena]
[timing: 2.0–3.0s, uma vez] [restrição: ombro e cotovelo estáveis]
[negativo: sem movimento de câmera, sem movimento de mão esquerda].“
2. Suave câmera push-in, sujeito congelado
“Enquadramento de retrato, fundo neutro.
[ator: câmera] [ação: zoom-in] [magnitude: 5%] [duração: 0–2s, linear]
[restrição: sujeito perfeitamente parado, apenas respirando]
[negativo: sem dolly, sem tremor manual].“
3. Sacudidas oculares sem movimento de cabeça
“Close-up de rosto, luz suave.
[ator: olhos] [ação: duas sacudidas rápidas esquerda→centro]
[timing: dentro do primeiro segundo]
[restrição: cabeça travada, expressão neutra]
[negativo: sem sorriso, sem piscada durante sacudidas].“
4. Virar página com dedo, não braço inteiro
“Plano aéreo de um caderno aberto.
[ator: dedo indicador direito] [ação: deslizar canto da página e virar]
[magnitude: página única] [timing: 1.5–2.5s]
[restrição: pulso mínimo, antebraço ancorado à mesa]
[negativo: sem movimento de câmera].“
5. Inclinação de cabeça de reconhecimento, apenas micro
“Plano médio.
[ator: cabeça] [ação: pequena inclinação direita depois retorno] [magnitude: 5–7°]
[timing: 1.0–1.4s]
[restrição: ombros nivelados]
[negativo: sem sorriso, sem mudança de olho].“
6. Dolly-direita com paralaxe, sujeito ancorado
“Cena de estúdio.
[ator: câmera] [ação: dolly-direita] [magnitude: pequena, 20 cm]
[duração: 0–2s, suave]
[restrição: sujeito permanece enquadrado no centro, paralaxe de fundo visível]
[negativo: sem zoom].“
7. Apenas micro-flutuar de tecido
“Retrato com brisa leve.
[ator: bainha de jaqueta] [ação: breve agitação]
[timing: 0.8–1.2s]
[restrição: cabelo e folhagem parados]
[negativo: sem vento global].“
8. Digitação com dedos isolados
“Cena de mesa, laptop.
[ator: dedos ambas as mãos] [ação: digitar suavemente]
[timing: surtos intermitentes]
[restrição: pulsos plantados, cotovelos estáveis, torso parado]
[negativo: sem tremor de câmera].”

9. Levantada de xícara sem movimento de ombro
“Mesa de café.
[ator: mão direita] [ação: levantar xícara de cerâmica, beber, repousar]
[timing: 1.0–2.5s]
[restrição: ombro e pescoço quietos, cotovelo mínimo]
[negativo: sem movimento de câmera, sem surto de vapor].“
10. Movimento de fundo enquanto sujeito segura
“Retrato de rua.
[ator: pedestres de fundo] [ação: passagem lenta esquerda→direita]
[restrição: sujeito imóvel, olhos na câmera]
[negativo: sem balanço de sujeito, sem zoom].”
Se precisar escalar a precisão, empilhe uma restrição a mais em vez de outra ação. Mantém o clipe legível, para você e para o modelo. Sem julgamentos aqui — todos nós já estivemos lá.
Tudo bem, sua vez — não me deixe na mão: Qual é a surpresa de licença “open weights” mais ridícula que você já enfrentou? Deixe sua história nos comentários!





