Corrigir Erros do LTX-2 no ComfyUI: Soluções para OOM, Quadros Pretos e Flicker

Ei, pessoal, sou a Dora. Não comecei a depurar LTX-2 no ComfyUI de propósito. Tudo começou com uma pequena pausa: uma janela de visualização preta depois de um fluxo de trabalho que eu havia executado uma dúzia de vezes. Nenhuma falha dramática. Apenas… nada. Tentei novamente, observei o console, ajustei uma configuração ou duas. Até o final da semana (testado de 6 a 10 de janeiro de 2026), eu havia coletado um punhado de correções que se repetiram. Isso não é um grande tutorial, mais como notas que eu daria para um amigo que também está tentando fazer o LTX-2 funcionar sem transformar sua manhã em uma reinstalação de driver. Você sabe, aquele tipo de caos silencioso que todos nós conhecemos bem demais.

Diagnóstico em 60 Segundos (mapeamento de sintoma → causa)

Quando o LTX-2 se comporta mal no ComfyUI, descobri que reconhecimento rápido de padrões bate adivinhação. Aqui está o mapa de 60 segundos que executo antes de tocar em qualquer coisa pesada:

Sintoma: Cintilação ou desvio de fotograma para fotograma
Causa provável: orientação instável (CFG muito alta), sementes alteradas, configurações de movimento excessivamente fortes.
Tente rápido: corrija a semente, baixe CFG um pouco, diminua movimento/denoise, adicione uma etapa de consistência temporal.

Sintoma: Mudanças de cor estranhas, “neve” ou blocos esticados
Causa provável: incompatibilidade de peso/versão, VAE incorreto, cache corrompido ou download parcial.
Tente rápido: re-verificar hashes, limpar cache de modelos, confirmar compatibilidade de VAE.

Sintoma: Erros de nó sobre formas ou NoneType
Causa provável: um nó não produziu saída (falha anterior) ou versões de nó/modelo incompatíveis.
Tente rápido: isole o ramo com falha, execute até aquele nó apenas, verifique o console do ComfyUI para a primeira linha de erro real. Se um desses acertar, eu paro. Uma mudança por vez. Então executo um clipe de 2 a 3 segundos para não queimar tempo em renderizações longas.

Correção OOM: Ordem de Downgrade de Resolução / Precisão / Lote

Minha rotina OOM do LTX-2 é chata, mas funciona. Faço isso nesta ordem e só passo para o próximo passo se o OOM persistir:

1. Resolução primeiro

Reduza altura/largura em 20-30% em vez de cortar pela metade. Muitos gráficos LTX-2 são sensíveis à passada (múltiplos de 8 ou 16). Mantenho dimensões divisíveis por 16 para evitar preenchimento oculto.
Se você está mirando em 1024×576, tente 896×504. Deixe-me lhe dizer, fica mais perto do original do que você esperaria.

2. Precisão próxima

Alterne a precisão do modelo para fp16 (ou bf16 se sua pilha suportar) no nó de carregador relevante. Em GPUs de consumidor NVIDIA, fp16 geralmente oferece a maior economia de memória.
Precisão mista é aceitável, mas evito alternar por nó durante a execução. Comprometa-se com uma precisão para as partes pesadas.

3. Tamanho do lote por último

Defina o lote como 1 para amostragem de vídeo. Até pequenos lotes multiplicam ativações-chave na memória. Só aumento o lote para latentes ou visualizações rápidas.

Também notei uma vitória sutil: bloqueie a semente ao ajustar OOM. A aleatoriedade pode mascarar se sua última mudança realmente ajudou.

Tela Preta: Problemas de Carregamento de Modelo vs Decodificação

Minha primeira tela preta desta semana não foi uma falha de modelo. Foi uma peculiaridade de decodificação.

Como separo os dois rapidamente

Verifique o tamanho do arquivo e a duração

Se o vídeo tem o comprimento certo e aproximadamente o tamanho esperado, os quadros podem estar lá. Seu reprodutor pode não gostar do formato de pixel ou espaço de cor.
Re-codifique com uma linha de base segura:
ffmpeg -i input.mp4 -pix_fmt yuv420p -c:v libx264 -crf 18 output.mp4
(veja a documentação do FFmpeg para mais opções de codificação) Examine o console do ComfyUI
Problemas reais de carregamento de modelos se anunciam: pesos ausentes, chaves incompatíveis ou incompatibilidade de hash VAE/modelo.
Se você vir registros de amostragem bem-sucedidos e nenhuma exceção, é provavelmente um caminho de exibição/codificação.

Incompatibilidades de dimensão latente

Pipelines LTX-2 esperam certas passadas (geralmente múltiplos de 16). Se suas entradas latentes ou de controle não corresponderem, você pode obter quadros em branco ou quase pretos.
Verifico que todos os nós de redimensionamento acontecem antes de o modelo esperá-los, e que todos os ramos concordam com largura/altura.

Surpresas de intervalo de cor

Intervalo completo vs limitado pode parecer esmagado para preto em alguns reprodutores. Uma re-codificação rápida (acima) geralmente resolve.

Se for um problema de carregamento de modelo, vou à fonte: verifique se o caminho do checkpoint LTX-2 no nó carregador aponta para o arquivo real, confirme a soma de verificação e certifique-se de que o formato de peso esperado do nó (safetensors vs ckpt) corresponde ao arquivo. A documentação oficial do ComfyUI e o README do modelo são as únicas páginas em que confio para notas de versão/formato.

Correção de Cintilação: Parâmetros de Estabilidade e Ancoragem de Prompt

Cintilação nem sempre é um bug. Às vezes é o modelo fazendo exatamente o que foi instruído, com muita liberdade.

O que me acalmou as coisas:

Corrija a semente
Bloqueio a semente para qualquer teste A/B. Remove uma variável escorregadia de uma vez.
Baixe CFG um pouco
Se estou em 8–9, tento 6. Orientação excessivamente alta pode puxar quadros em direções diferentes.
Denoise e força de movimento
Reduções suaves aqui (10–20%) geralmente ajudam mais do que aumentar passos. Descobri que um pouco menos de denoise preserva melhor os sinais temporais.
Ancoragem de prompt
Mantenha um prompt base estável e mova as alterações para uma pequena seção explícita (quadros-chave ou uma breve observação). Alterar a sentença inteira entre quadros convida à desvio.
Passe de consistência temporal
Se seu gráfico tem um nó temporal/consistência, execute-o levemente. Não vai inventar detalhes, mas pode limpar o tremor.
Escolha do amostrador
Testo 2–3 amostradores com a mesma semente. Alguns são mais saltos em vídeo. Se um acalma as bordas na mesma contagem de passos, eu o mantenho.

Pequena observação: parei de perseguir “coerência de quadro perfeita”. Meu objetivo é menos fadiga mental ao editar, algo que eu possa cortar, não perfeição sob microscópio.

Saída Corrompida: Incompatibilidade de Peso / Erros de Caminho

Corrupção apareceu para mim como blocos rosa, neve brilhante ou faixas de cor que não correspondia ao prompt. Toda vez, era algo mundano:

Pesos incompatíveis
O carregador esperava uma variante LTX-2 específica: eu tinha uma diferente com nome similar. Agora incluo a data ou hash do modelo nos nomes de arquivo.
VAE incorreto
Trocar VAEs casualmente me mordeu. A correção foi simples: use o VAE especificado pelo documentação do nó LTX-2 ou o README do modelo. Se nenhum for especificado, padronize para o agrupado ou recomendado pelo autor do gráfico.
Downloads parciais
Um checkpoint de 3–8 GB falhando em 95% parece completo em uma visualização de pasta. Verifico o tamanho do arquivo contra a listagem do repositório e, quando disponível, verifico o hash.
Contratempos de caminho (especialmente no Windows)
Caracteres não-ASCII e caminhos muito longos quebraram carregamentos para mim no passado. Acredite em mim, mantenho caminhos de modelo curtos (por exemplo, D:\models\ltx2\…) e evito espaços quando posso.
Formatos mistos
safetensors vs .ckpt não são intercambiáveis em alguns nós. Combino a expectativa do nó.

Quando suspeito de corrupção, executo novamente um prompt conhecido e bom em uma resolução minúscula. Se isso estiver limpo, sei que o problema está em minha combinação atual, não na instalação inteira.

Leitura de Registro: Qual Camada Falhou

A maioria de meu tempo útil veio da leitura da primeira linha de falha, não da última dramática. O console do ComfyUI geralmente diz o suficiente se você abrandar por trinta segundos.

O que procuro:

CUDA fora de memória
Não é um bug. Reduz res/precisão/lote como acima. Se falhar no mesmo passo toda vez, você está atingindo um pico de ativação específico, diminua passos ou habilite atenção eficiente em memória.
CUDNN_STATUS_EXECUTION_FAILED ou acesso a memória ilegal
Frequentemente incompatibilidade de driver ou biblioteca. Noto meu CUDA, PyTorch, e versões de driver de GPU em um arquivo de texto. Se recentemente atualizei um, faço rollback ou reconstruo o venv. A documentação do ComfyUI tem uma pequena matriz de combinações conhecidas e boas.
Incompatibilidade de tamanho / erros de forma
Um tensor tem a forma errada. Isso é geralmente um problema de gráfico de nó: um redimensionamento acontece em um ramo e não em outro, ou uma entrada de controle espera uma escala diferente. Rastreio as dimensões onde divergem.
KeyError / chaves state_dict ausentes
Incompatibilidade de peso–nó. Compare as chaves listadas ausentes com o README do modelo. Variante de checkpoint incorreta ou nó desatualizado.
AttributeError: ‘NoneType’ …
Um nó anterior retornou nada. Executo o gráfico até aquele nó apenas. O primeiro None é o culpado real.

Dois hábitos que ajudaram:

Execute clipes curtos durante a depuração. Dez segundos de registros de falha desperdiçam muito menos tempo do que um minuto de silêncio.
Habilite qualquer alternância de depuração/verbose disponível no nó suspeito. Contexto extra bate adivinhação.

Mantenho um pequeno “cartão de ambiente” na pasta do projeto: modelo de GPU e VRAM, driver, CUDA, PyTorch, commit do ComfyUI, versões do pacote de nós e o hash do checkpoint LTX-2. Quando algo quebra, comparo com o cartão da semana passada antes de culpar o modelo.

Quando Mudar para Nuvem (atalho de solução de problemas do WaveSpeed)

Não me apresso para a nuvem para LTX-2, mas há momentos em que é a forma mais limpa de separar “o humor da minha máquina” de problemas reais.

Quando mudo

VRAM menor que 16 GB e preciso de saídas 1024p sem compromissos pesados.
Estou vendo travamentos instáveis amarrados a minhas versões locais de CUDA/driver, e não tenho tempo para reconstruir.
Quero uma segunda opinião: mesmo gráfico, hardware diferente.

O que faço no WaveSpeed (ou qualquer espaço de trabalho de GPU comparável)

Escolha uma imagem conhecida e boa (combinação CUDA/PyTorch documentada). Isso importa mais do que TFLOPS bruto quando você está depurando.
Sincronize apenas o gráfico mínimo, os pesos LTX-2 exatos (com hash) e um prompt de teste breve.
Execute o menor caso reproduzível primeiro. Se funciona na nuvem e não localmente, é provavelmente ambiente: se falha em ambos, é o gráfico ou pesos.

Custos e trade-offs

Você pagará por computação, sim. Mas uma repro limpa pode economizar uma tarde de roleta de driver.
Discos de nuvem também podem ocultar problemas de caminho, apenas de maneiras diferentes. Ainda mantenho caminhos curtos e ASCII.

Isso não é um impulso para mover seu fluxo de trabalho. É apenas um atalho silencioso quando você está preso e o prazo é mais alto que sua paciência.

Construímos o WaveSpeed para momentos exatamente como este — quando você apenas precisa de um ambiente de GPU limpo para descartar coisas rapidamente. Se você está preso depurando LTX-2, pode tentar nosso WaveSpeed aqui.

Qual é o bug LTX-2 mais maluco que você encontrou esta semana? Deixe um comentário e me avise se for uma nova armadilha.

Diagnóstico em 60 Segundos (mapeamento de sintoma → causa)

Correção OOM: Ordem de Downgrade de Resolução / Precisão / Lote

1. Resolução primeiro

2. Precisão próxima

3. Tamanho do lote por último

Tela Preta: Problemas de Carregamento de Modelo vs Decodificação

Como separo os dois rapidamente

Correção de Cintilação: Parâmetros de Estabilidade e Ancoragem de Prompt

Saída Corrompida: Incompatibilidade de Peso / Erros de Caminho

Leitura de Registro: Qual Camada Falhou

Quando Mudar para Nuvem (atalho de solução de problemas do WaveSpeed)

Quando mudo

O que faço no WaveSpeed (ou qualquer espaço de trabalho de GPU comparável)

Custos e trade-offs

Artigos relacionados

Seedance 2.0 em Breve: Modelo de Vídeo de Próxima Geração do ByteDance com Áudio Nativo

Guia Completo do Seedance 2.0: Criação de Vídeo Multimodal

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1: A Comparação Definitiva de Geração de Vídeos

Guia Completo do Seedream 5.0-Preview: Geração Inteligente de Imagens

Seedream 5.0 vs Nano Banana Pro vs GPT Image 1.5 vs Flux Klein vs Qwen Image: Comparação Completa

O Chrome com IA chegou: Evoluindo de Exibidor de Conteúdo para Compreensor de Conteúdo