Corrigir Erros do LTX-2 no ComfyUI: Soluções para OOM, Quadros Pretos e Flicker
Ei, pessoal, sou a Dora. Não comecei a depurar LTX-2 no ComfyUI de propósito. Tudo começou com uma pequena pausa: uma janela de visualização preta depois de um fluxo de trabalho que eu havia executado uma dúzia de vezes. Nenhuma falha dramática. Apenas… nada. Tentei novamente, observei o console, ajustei uma configuração ou duas. Até o final da semana (testado de 6 a 10 de janeiro de 2026), eu havia coletado um punhado de correções que se repetiram. Isso não é um grande tutorial, mais como notas que eu daria para um amigo que também está tentando fazer o LTX-2 funcionar sem transformar sua manhã em uma reinstalação de driver. Você sabe, aquele tipo de caos silencioso que todos nós conhecemos bem demais.
Diagnóstico em 60 Segundos (mapeamento de sintoma → causa)
Quando o LTX-2 se comporta mal no ComfyUI, descobri que reconhecimento rápido de padrões bate adivinhação. Aqui está o mapa de 60 segundos que executo antes de tocar em qualquer coisa pesada:
Sintoma: Cintilação ou desvio de fotograma para fotograma
Causa provável: orientação instável (CFG muito alta), sementes alteradas, configurações de movimento excessivamente fortes.
Tente rápido: corrija a semente, baixe CFG um pouco, diminua movimento/denoise, adicione uma etapa de consistência temporal.
Sintoma: Mudanças de cor estranhas, “neve” ou blocos esticados
Causa provável: incompatibilidade de peso/versão, VAE incorreto, cache corrompido ou download parcial.
Tente rápido: re-verificar hashes, limpar cache de modelos, confirmar compatibilidade de VAE.
Sintoma: Erros de nó sobre formas ou NoneType
Causa provável: um nó não produziu saída (falha anterior) ou versões de nó/modelo incompatíveis.
Tente rápido: isole o ramo com falha, execute até aquele nó apenas, verifique o console do ComfyUI para a primeira linha de erro real.
Se um desses acertar, eu paro. Uma mudança por vez. Então executo um clipe de 2 a 3 segundos para não queimar tempo em renderizações longas.
Correção OOM: Ordem de Downgrade de Resolução / Precisão / Lote
Minha rotina OOM do LTX-2 é chata, mas funciona. Faço isso nesta ordem e só passo para o próximo passo se o OOM persistir:
1. Resolução primeiro
- Reduza altura/largura em 20-30% em vez de cortar pela metade. Muitos gráficos LTX-2 são sensíveis à passada (múltiplos de 8 ou 16). Mantenho dimensões divisíveis por 16 para evitar preenchimento oculto.
- Se você está mirando em 1024×576, tente 896×504. Deixe-me lhe dizer, fica mais perto do original do que você esperaria.
2. Precisão próxima
- Alterne a precisão do modelo para fp16 (ou bf16 se sua pilha suportar) no nó de carregador relevante. Em GPUs de consumidor NVIDIA, fp16 geralmente oferece a maior economia de memória.
- Precisão mista é aceitável, mas evito alternar por nó durante a execução. Comprometa-se com uma precisão para as partes pesadas.
3. Tamanho do lote por último
- Defina o lote como 1 para amostragem de vídeo. Até pequenos lotes multiplicam ativações-chave na memória. Só aumento o lote para latentes ou visualizações rápidas.
Também notei uma vitória sutil: bloqueie a semente ao ajustar OOM. A aleatoriedade pode mascarar se sua última mudança realmente ajudou.
Tela Preta: Problemas de Carregamento de Modelo vs Decodificação
Minha primeira tela preta desta semana não foi uma falha de modelo. Foi uma peculiaridade de decodificação.
Como separo os dois rapidamente
Verifique o tamanho do arquivo e a duração
-
Se o vídeo tem o comprimento certo e aproximadamente o tamanho esperado, os quadros podem estar lá. Seu reprodutor pode não gostar do formato de pixel ou espaço de cor.
-
Re-codifique com uma linha de base segura:
ffmpeg -i input.mp4 -pix_fmt yuv420p -c:v libx264 -crf 18 output.mp4
(veja a documentação do FFmpeg para mais opções de codificação)
Examine o console do ComfyUI -
Problemas reais de carregamento de modelos se anunciam: pesos ausentes, chaves incompatíveis ou incompatibilidade de hash VAE/modelo.
-
Se você vir registros de amostragem bem-sucedidos e nenhuma exceção, é provavelmente um caminho de exibição/codificação.
Incompatibilidades de dimensão latente
- Pipelines LTX-2 esperam certas passadas (geralmente múltiplos de 16). Se suas entradas latentes ou de controle não corresponderem, você pode obter quadros em branco ou quase pretos.
- Verifico que todos os nós de redimensionamento acontecem antes de o modelo esperá-los, e que todos os ramos concordam com largura/altura.
Surpresas de intervalo de cor
- Intervalo completo vs limitado pode parecer esmagado para preto em alguns reprodutores. Uma re-codificação rápida (acima) geralmente resolve.
Se for um problema de carregamento de modelo, vou à fonte: verifique se o caminho do checkpoint LTX-2 no nó carregador aponta para o arquivo real, confirme a soma de verificação e certifique-se de que o formato de peso esperado do nó (safetensors vs ckpt) corresponde ao arquivo. A documentação oficial do ComfyUI e o README do modelo são as únicas páginas em que confio para notas de versão/formato.
Correção de Cintilação: Parâmetros de Estabilidade e Ancoragem de Prompt
Cintilação nem sempre é um bug. Às vezes é o modelo fazendo exatamente o que foi instruído, com muita liberdade.
O que me acalmou as coisas:
-
Corrija a semente
Bloqueio a semente para qualquer teste A/B. Remove uma variável escorregadia de uma vez. -
Baixe CFG um pouco
Se estou em 8–9, tento 6. Orientação excessivamente alta pode puxar quadros em direções diferentes. -
Denoise e força de movimento
Reduções suaves aqui (10–20%) geralmente ajudam mais do que aumentar passos. Descobri que um pouco menos de denoise preserva melhor os sinais temporais. -
Ancoragem de prompt
Mantenha um prompt base estável e mova as alterações para uma pequena seção explícita (quadros-chave ou uma breve observação). Alterar a sentença inteira entre quadros convida à desvio. -
Passe de consistência temporal
Se seu gráfico tem um nó temporal/consistência, execute-o levemente. Não vai inventar detalhes, mas pode limpar o tremor. -
Escolha do amostrador
Testo 2–3 amostradores com a mesma semente. Alguns são mais saltos em vídeo. Se um acalma as bordas na mesma contagem de passos, eu o mantenho.
Pequena observação: parei de perseguir “coerência de quadro perfeita”. Meu objetivo é menos fadiga mental ao editar, algo que eu possa cortar, não perfeição sob microscópio.
Saída Corrompida: Incompatibilidade de Peso / Erros de Caminho
Corrupção apareceu para mim como blocos rosa, neve brilhante ou faixas de cor que não correspondia ao prompt. Toda vez, era algo mundano:
-
Pesos incompatíveis
O carregador esperava uma variante LTX-2 específica: eu tinha uma diferente com nome similar. Agora incluo a data ou hash do modelo nos nomes de arquivo. -
VAE incorreto
Trocar VAEs casualmente me mordeu. A correção foi simples: use o VAE especificado pelo documentação do nó LTX-2 ou o README do modelo. Se nenhum for especificado, padronize para o agrupado ou recomendado pelo autor do gráfico.
-
Downloads parciais
Um checkpoint de 3–8 GB falhando em 95% parece completo em uma visualização de pasta. Verifico o tamanho do arquivo contra a listagem do repositório e, quando disponível, verifico o hash. -
Contratempos de caminho (especialmente no Windows)
Caracteres não-ASCII e caminhos muito longos quebraram carregamentos para mim no passado. Acredite em mim, mantenho caminhos de modelo curtos (por exemplo,D:\models\ltx2\…) e evito espaços quando posso. -
Formatos mistos
safetensors vs .ckpt não são intercambiáveis em alguns nós. Combino a expectativa do nó.
Quando suspeito de corrupção, executo novamente um prompt conhecido e bom em uma resolução minúscula. Se isso estiver limpo, sei que o problema está em minha combinação atual, não na instalação inteira.
Leitura de Registro: Qual Camada Falhou
A maioria de meu tempo útil veio da leitura da primeira linha de falha, não da última dramática. O console do ComfyUI geralmente diz o suficiente se você abrandar por trinta segundos.
O que procuro:
-
CUDA fora de memória
Não é um bug. Reduz res/precisão/lote como acima. Se falhar no mesmo passo toda vez, você está atingindo um pico de ativação específico, diminua passos ou habilite atenção eficiente em memória. -
CUDNN_STATUS_EXECUTION_FAILED ou acesso a memória ilegal
Frequentemente incompatibilidade de driver ou biblioteca. Noto meu CUDA, PyTorch, e versões de driver de GPU em um arquivo de texto. Se recentemente atualizei um, faço rollback ou reconstruo o venv. A documentação do ComfyUI tem uma pequena matriz de combinações conhecidas e boas.
-
Incompatibilidade de tamanho / erros de forma
Um tensor tem a forma errada. Isso é geralmente um problema de gráfico de nó: um redimensionamento acontece em um ramo e não em outro, ou uma entrada de controle espera uma escala diferente. Rastreio as dimensões onde divergem. -
KeyError / chaves state_dict ausentes
Incompatibilidade de peso–nó. Compare as chaves listadas ausentes com o README do modelo. Variante de checkpoint incorreta ou nó desatualizado. -
AttributeError: ‘NoneType’ …
Um nó anterior retornou nada. Executo o gráfico até aquele nó apenas. O primeiro None é o culpado real.
Dois hábitos que ajudaram:
- Execute clipes curtos durante a depuração. Dez segundos de registros de falha desperdiçam muito menos tempo do que um minuto de silêncio.
- Habilite qualquer alternância de depuração/verbose disponível no nó suspeito. Contexto extra bate adivinhação.
Mantenho um pequeno “cartão de ambiente” na pasta do projeto: modelo de GPU e VRAM, driver, CUDA, PyTorch, commit do ComfyUI, versões do pacote de nós e o hash do checkpoint LTX-2. Quando algo quebra, comparo com o cartão da semana passada antes de culpar o modelo.
Quando Mudar para Nuvem (atalho de solução de problemas do WaveSpeed)
Não me apresso para a nuvem para LTX-2, mas há momentos em que é a forma mais limpa de separar “o humor da minha máquina” de problemas reais.
Quando mudo
- VRAM menor que 16 GB e preciso de saídas 1024p sem compromissos pesados.
- Estou vendo travamentos instáveis amarrados a minhas versões locais de CUDA/driver, e não tenho tempo para reconstruir.
- Quero uma segunda opinião: mesmo gráfico, hardware diferente.
O que faço no WaveSpeed (ou qualquer espaço de trabalho de GPU comparável)
- Escolha uma imagem conhecida e boa (combinação CUDA/PyTorch documentada). Isso importa mais do que TFLOPS bruto quando você está depurando.
- Sincronize apenas o gráfico mínimo, os pesos LTX-2 exatos (com hash) e um prompt de teste breve.
- Execute o menor caso reproduzível primeiro. Se funciona na nuvem e não localmente, é provavelmente ambiente: se falha em ambos, é o gráfico ou pesos.
Custos e trade-offs
- Você pagará por computação, sim. Mas uma repro limpa pode economizar uma tarde de roleta de driver.
- Discos de nuvem também podem ocultar problemas de caminho, apenas de maneiras diferentes. Ainda mantenho caminhos curtos e ASCII.
Isso não é um impulso para mover seu fluxo de trabalho. É apenas um atalho silencioso quando você está preso e o prazo é mais alto que sua paciência.
Construímos o WaveSpeed para momentos exatamente como este — quando você apenas precisa de um ambiente de GPU limpo para descartar coisas rapidamente. Se você está preso depurando LTX-2, pode tentar nosso WaveSpeed aqui.
Qual é o bug LTX-2 mais maluco que você encontrou esta semana? Deixe um comentário e me avise se for uma nova armadilha.





