Apresentando WaveSpeedAI LTX 2 19b Control na WaveSpeedAI
Apresentando LTX-2 19B ControlNet: Transformação de Vídeo-para-Vídeo com Precisão com Orientação de Pose, Profundidade e Borda
A paisagem da geração de vídeo com IA atingiu um novo marco. O LTX-2 19B ControlNet traz o poder da orientação estrutural para a transformação de vídeo, permitindo que criadores reformulem conteúdo de vídeo enquanto preservam o movimento e a dinâmica que tornam a filmagem atraente. Construído na arquitetura revolucionária de Transformador de Difusão de 19 bilhões de parâmetros da Lightricks, este modelo representa um grande avanço na geração de vídeo controlada.
O que é LTX-2 19B ControlNet?
LTX-2 19B ControlNet é um modelo de transformação vídeo-para-vídeo que usa detecção de pose, profundidade ou borda canny para guiar a geração de novo conteúdo de vídeo enquanto mantém a estrutura de movimento do seu entrada. O modelo opera na mesma base poderosa que a família LTX-2—um transformador de difusão assimétrico de duplo fluxo com 48 camadas que processa tokens de vídeo e áudio simultaneamente.
O que distingue este modelo é sua capacidade de gerar conteúdo de áudio-vídeo sincronizado de até 20 segundos de duração. A arquitetura divide seus 19 bilhões de parâmetros estrategicamente: aproximadamente 14 bilhões para processamento de vídeo e 5 bilhões para áudio, permitindo saída multimodal coerente em uma única passagem.
A integração do ControlNet permite que você escolha exatamente como o modelo interpreta seu vídeo de origem. Se você deseja preservar movimento humano através da detecção de pose, manter a estrutura da cena através de mapeamento de profundidade, ou seguir bordas precisas através da detecção canny, você tem controle total sobre o processo de transformação.
Recursos Principais
Três Modos de Orientação para Cada Caso de Uso
-
Modo Pose: Extrai informações esqueléticas e de pose de seu vídeo de entrada, ideal para transferência de movimento humano e de personagens. Este modo rastreia confiavelmente o posicionamento do corpo entre quadros, tornando-o perfeito para sequências de dança, movimentos atléticos ou qualquer conteúdo onde o movimento humano é o foco.
-
Modo Profundidade: Cria mapas de profundidade de seu vídeo de origem para preservar a estrutura da cena e as relações espaciais. Use isso quando quiser transformar ambientes, alterar estilos visuais ou aplicar efeitos criativos mantendo a geometria fundamental de sua filmagem.
-
Modo Borda Canny: Detecta bordas em seu material de origem para guiar a geração enquanto preserva formas e contornos. Este modo é excelente em aplicações de transferência de estilo onde você precisa manter limites visuais precisos.
Manuseio Flexível de Áudio
O modelo oferece três modos de áudio para corresponder às suas necessidades criativas:
- Preservar: Mantenha a faixa de áudio original do seu vídeo de entrada—essencial para cenários de sincronização labial
- Gerar: Crie novo áudio sincronizado que corresponda aos visuais transformados
- Nenhum: Saída de vídeo silencioso para projetos onde você adicionará áudio separadamente
Integração de Imagem de Referência
Envie uma imagem de referência para definir a aparência do seu vídeo transformado. O modelo aplicará as características visuais de sua referência enquanto o vídeo de entrada controla todo o movimento. Isso permite transformações poderosas orientadas por personagem onde você pode animar qualquer imagem de personagem com movimento da filmagem de referência.
Melhoria de Prompt Integrada
O melhorador de prompt integrado melhora automaticamente suas descrições de texto para melhores resultados. Combinado com o codificador de texto Gemma-3 do modelo, que compreende dicas de linguagem nuançadas, incluindo emoções de personagens, movimentos de câmera e direções de iluminação, este recurso ajuda você a alcançar resultados profissionais sem engenharia de prompt extensiva.
Casos de Uso do Mundo Real
Animação de Personagem e Transferência de Movimento
Transforme uma imagem de personagem estática em um vídeo totalmente animado aplicando movimento de filmagem de referência. Se você está trabalhando com personagens ilustrados, fotografias ou avatares digitais, o modo de orientação de pose captura movimento com precisão enquanto a imagem de referência define a saída visual.
Transferência de Dança para Mídias Sociais
Crie conteúdo atraente transferindo movimentos de dança virais para qualquer assunto. O modo pose rastreia o posicionamento do corpo quadro a quadro, permitindo que você transforme vídeos de dança em animações estilizadas—perfeito para conteúdo TikTok, Instagram Reels e YouTube Shorts.
Transferência de Estilo de Vídeo
Aplique transformações visuais dramáticas a filmagem existente enquanto preserva o movimento original. Use modo de profundidade para manter a estrutura da cena ao alterar estilos visuais, ou modo de borda canny quando a preservação de forma precisa é mais importante.
Consistência de Personagem na Produção de Vídeo
Para criadores trabalhando com conteúdo de série ou vídeos marcados, o recurso de imagem de referência garante aparência consistente do personagem em vários clipes. O movimento pode vir de diferentes vídeos de origem enquanto a aparência do personagem permanece uniforme.
Criação de Vídeo com Sincronização Labial
Preserve o áudio original enquanto transforma a aparência visual de seu assunto. Este fluxo de trabalho é particularmente valioso para criar conteúdo dublado, versões animadas de filmagem ao vivo ou modificações de vídeo que preservam a privacidade.
Começando no WaveSpeedAI
Usar LTX-2 19B ControlNet no WaveSpeedAI é direto:
- Envie seu vídeo de origem — Isso fornece a estrutura de movimento para sua saída
- Adicione uma imagem de referência (opcional) — Defina a aparência que você deseja em seu vídeo transformado
- Escreva seu prompt — Descreva o que você deseja criar
- Selecione seu modo de controle — Escolha pose, profundidade ou canny com base em suas necessidades
- Escolha o manuseio de áudio — Preserve original, gere novo ou nenhum
- Defina sua resolução — 480p para iterações rápidas, 720p para qualidade equilibrada, 1080p para renderizações finais
- Gerar — Envie e baixe seu vídeo transformado
import wavespeed
output = wavespeed.run(
"wavespeed-ai/ltx-2-19b/control",
{
"video": "https://example.com/source-video.mp4",
"image": "https://example.com/reference.jpg",
"prompt": "A person dancing in a futuristic neon city",
"mode": "pose",
"audio_mode": "generate",
"resolution": "720p"
},
)
print(output["outputs"][0])
Preço
O modelo segue um preço direto por segundo com base na resolução:
| Resolução | 5s | 10s | 15s | 20s |
|---|---|---|---|---|
| 480p | $0,15 | $0,30 | $0,45 | $0,60 |
| 720p | $0,20 | $0,40 | $0,60 | $0,80 |
| 1080p | $0,30 | $0,60 | $0,90 | $1,20 |
Dicas Profissionais para Melhores Resultados
- Combine poses iniciais: Alinhe a pose do assunto em sua imagem de referência com a pose inicial em seu vídeo de origem para resultados perfeitos
- Escolha o modo certo: Use pose para movimento humano/personagem, profundidade para estrutura de cena, canny para precisão baseada em bordas
- Iterate com eficiência: Comece em 480p para refinar sua abordagem, depois renderize saída final em 720p ou 1080p
- Estratégia de áudio: Preserve áudio para projetos de sincronização labial, gere para conteúdo novo ou use nenhum quando adicionar áudio em pós-produção
Por Que WaveSpeedAI?
WaveSpeedAI oferece o ambiente ideal para executar LTX-2 19B ControlNet:
- Sem inicializações a frio: Seus trabalhos começam a processar imediatamente sem atrasos de infraestrutura
- Inferência otimizada: Implantação otimizada para NVIDIA garante os tempos de geração mais rápidos possíveis
- Preço transparente: Pague apenas pelo que você gera com faturamento claro por segundo
- API pronta para produção: Integre diretamente em seus aplicativos e fluxos de trabalho
Comece a Criar Hoje
LTX-2 19B ControlNet abre novas possibilidades para criadores de vídeo, animadores e desenvolvedores que precisam de controle preciso sobre transformações de vídeo. A combinação de modos de orientação ControlNet, manuseio flexível de áudio e a poderosa arquitetura DiT de 19B oferece resultados de qualidade profissional a preços acessíveis.
Pronto para transformar seus vídeos com orientação estrutural precisa? Experimente LTX-2 19B ControlNet no WaveSpeedAI e descubra o que é possível quando você tem controle total sobre geração de vídeo com IA.





