← Blog

Atualização do LTX-2 para LTX-2.3: Compatibilidade, Quebras de LoRA e Migração (2026)

Já usa o LTX-2? Veja o que quebra, o que muda e o que verificar antes de atualizar para o LTX-2.3 — abordando tamanho do modelo, nós do ComfyUI, compatibilidade com LoRA e diferenças de API.

12 min read
Atualização do LTX-2 para LTX-2.3: Compatibilidade, Quebras de LoRA e Migração (2026)

Olá, sou a Dora. Não planejei uma semana de atualização. Só queria re-executar um prompt antigo de um deck de cliente. Mesma seed, mesmas configurações, supostamente “o mesmo” modelo — exceto que não era. LTX-2.3 chegou na minha pasta, e as imagens pareciam um pouco mais limpas, um toque mais literais… e meu estilo aprimorado com LoRA havia sumido. Essa pequena discrepância me fez cair numa toca de coelho. Ao longo de alguns dias em março de 2026, testei a atualização do ltx-2 para o ltx-2.3 nos meus pipelines habituais do ComfyUI e na API gerenciada que uso para trabalhos em lote. Aqui está o que realmente mudou, o que se manteve estável, e onde aparecem os atritos quando você está fazendo trabalho real, não demos.

O Que Realmente Mudou Entre o LTX-2 e o 2.3

Vou pular as afirmações de marketing e me ater às partes que afetaram meus fluxos de trabalho existentes.

  • Os prompts são interpretados de forma mais literal. Percebi que o 2.3 segue dicas de posicionamento (“esquerda/direita”, “primeiro plano/fundo”) de forma mais consistente. Ótimo para layouts de produtos: um pouco rígido para prompts artísticos que dependiam da fluidez do LTX-2.
  • O contraste e a saturação ficam mais altos por padrão. Meus presets de iluminação neutra saíram mais vibrantes no 2.3. Reduzi o guidance em ~0,5–1,0 e diminuí menos o contraste na pós-produção.
  • As seeds não são 1:1 entre versões. Mesmo com a mesma seed, o LTX-2.3 divergiu após ~10–12 etapas nas minhas execuções. Se você precisa de re-renderizações com pixels estáveis de trabalhos antigos, não conte com isso.
  • O tratamento de proporção de aspecto está mais sensato. O 2.3 respeitou tamanhos não quadrados (p. ex., 1024×1536) com menos elementos distorcidos. Pude eliminar alguns dos hacks de canvas que usava no LTX-2.
  • Os padrões do sampler mudaram. O scheduler recomendado no 2.3 (e sua curva de etapas) me levou a usar menos etapas para o mesmo nível de detalhe. Meu ponto ideal passou de ~28–32 etapas para ~22–26. O throughput melhorou um pouco na mesma GPU.

Nada disso é dramático. Mas é suficiente para dobrar um pipeline de maneiras pequenas, às vezes bem-vindas… e para quebrar qualquer coisa que dependa de reprodutibilidade exata, especialmente LoRAs.

Verificação da Realidade do Tamanho do Modelo: Implicações para Implantação Local

Rodei ambas as versões numa GPU 4090 de 24 GB e numa GPU de laptop com 8 GB. Esta é a parte que eu gostaria que as notas de versão enfatizassem mais: o teto prático do que sua placa pode carregar e ainda funcionar tranquilamente.

Comparação de VRAM e Armazenamento (dev / fp8 / distilled nas duas versões)

Aqui está o que observei e o que importou na prática:

  • Checkpoints dev/completos: Na 4090, tanto as builds “dev” do LTX-2 quanto do LTX-2.3 carregaram, mas o 2.3 ficou um pouco mais pesado em VRAM em tempo de execução (aproximadamente +0,5–1,2 GB nas minhas execuções com o mesmo sampler/etapas). Se você está com pouca margem para gerações em alta resolução, essa diferença importa. Na placa de 8 GB, as builds dev completas não eram realistas sem offloading.
  • Variantes FP8/quantizadas: A build fp8 do 2.3 liberou ~25–35% de VRAM em comparação com precisão total nos meus testes, ao custo de detalhes finos ligeiramente mais frágeis ao usar pouquíssimas etapas. Para saídas comuns em 1K, não me incomodei. Se você faz composição ou corte agressivo, talvez se importe. Para as vantagens práticas da quantização FP8 na implantação, consultei o guia oficial da NVIDIA sobre treinamento de IA em precisão reduzida.
  • Distilled: O checkpoint distilled do 2.3 funcionou como um meio-termo prático. Menor footprint de armazenamento, inícios a quente visivelmente mais rápidos, pequena compensação em micro-detalhes de borda. Para imagens prontas para redes sociais e docs internos, eu escolheria o distilled 2.3 em vez do completo 2.0.
  • Footprint em disco: Espere um leve aumento para as variantes do 2.3 em relação ao 2.0. Não é grande, mas precisei podar LoRAs experimentais antigos para manter o disco temporário limpo.

Uma pequena nota do dia a dia: quando a margem de VRAM caiu abaixo de ~2 GB restantes, vi OOMs ocasionais durante passes de alta resolução com tiling no 2.3. Reduzir a sobreposição do tiling ou usar fp8 estabilizou o processo.

Compatibilidade de Fluxos de Trabalho do ComfyUI: O Que Ainda Funciona, O Que Precisa de Atualização

Mantive minha configuração do ComfyUI praticamente intacta e troquei os checkpoints. Consultei principalmente o repositório oficial do ComfyUI para garantir a compatibilidade dos fluxos de trabalho durante meus testes.

O que ainda funcionou sem problemas:

  • Grafos básicos de texto para imagem com conditioning → sampler → VAE decode. Pude trocar pelo loader 2.3 e renderizar sem reconstruir o grafo.
  • Samplers comuns (p. ex., famílias DPM++) funcionaram bem. Só ajustei etapas e guidance para corresponder à nova curva.
  • Fluxos de trabalho de alta resolução com upscalers latentes ainda funcionaram, embora eu tenha reduzido as etapas da segunda fase em ~20% sem perder detalhes.

O que precisou de atualizações:

  • Nós de injeção de LoRA: Meus LoRAs do LTX-2 não se conectaram bem ao 2.3. Mesmo quando o nó me deixou conectar, os resultados estavam errados — o estilo desviava ou colapsava. Mais sobre isso abaixo.
  • Caminhos e formatos de checkpoint: Os checkpoints do 2.3 que testei vieram com nomes de pastas diferentes e uma referência de configuração ligeiramente diferente. Tive que atualizar os caminhos do nó Checkpoint Loader e confirmar o pareamento do VAE.
  • Padrões de parâmetros: Meus presets “padrão” antigos (CFG 6,5, etapas ~30) produziram contraste mais duro no 2.3. Reduzir o CFG para ~5,5 e as etapas para ~24 restabeleceu o equilíbrio que eu gostava.
  • Prompts negativos: Passei a depender menos de listas negativas longas. O 2.3 pareceu evitar certos artefatos de forma nativa (as mãos melhoraram um pouco nas minhas poses de produto). Reduzi os negativos para diminuir o overhead de prompt.

Mudanças nos Nós, Caminhos de Checkpoint e Diferenças de Parâmetros

  • Mudanças nos nós: Não precisei de novos nós personalizados para a geração principal, mas atualizei meu nó de carregamento de modelo para uma versão mais recente do ComfyUI para evitar incompatibilidades de metadados. Se você está alguns meses atrasado no ComfyUI, atualize primeiro — isso evita erros estranhos.
  • Caminhos de checkpoint: Mantenha as pastas 2.0 e 2.3 separadas. Uso um esquema de nomenclatura claro (nome_modelo/versão/precisão) para que os jobs em lote não peguem o arquivo errado.
  • Diferenças de parâmetros: O 2.3 pareceu mais sensível a variações de CFG. Pequenas mudanças (~0,5) tiveram um impacto visual maior do que no 2.0. Além disso, menos etapas deram detalhes similares: ir além de ~26 em imagens 1K retornou retornos decrescentes nos meus testes.

Compatibilidade de LoRA: Por Que os LoRAs Existentes Não Transferem Diretamente

Esta foi a maior surpresa, e a mais cara se você construiu uma biblioteca de estilos no LTX-2.

Meus LoRAs do LTX-2 não transferiram de forma significativa. A versão curta: mudanças no modelo base (espaço de embedding, blocos de atenção, às vezes normalização e mudanças no VAE) significam que os deltas aprendidos não mapeiam corretamente. Você pode forçar isso, mas vai lutar contra tons de cor estranhos, deriva de formas, ou o temido “tudo vira plástico bege”. Se seu estilo depende muito de LoRAs, é recomendado tratar o LTX-2.3 como um novo modelo base e retreinar seguindo o guia oficial de treinamento de LoRA do Hugging Face.

Do ponto de vista prático: se sua aparência depende de LoRAs, espere tratar o LTX-2.3 como uma nova base e retreinar.

O Que Você Precisa Retreinar e o Custo Estimado

O que mantive:

  • Dataset: Reutilizei meu conjunto limpo e legendado (cerca de 300–800 imagens por estilo, dependendo da variedade). Legendas melhores ajudaram mais no 2.3 do que volume bruto.
  • Configurações: Taxas de aprendizado mais baixas do que as que usei para o 2.0, para evitar saturação excessiva. Rank/dim permaneceram similares, mas reduzi as etapas de treinamento em ~10–15%.
  • Validação: Validei a cada poucos centenas de etapas com os novos prompts base, não com os legados. Prompts antigos me tendenciavam em direção a alvos errados.

Custos, em termos práticos:

  • Tempo: Cerca de 3–5 horas por LoRA numa única 4090 para conjuntos médios, incluindo validação e pequenas reinicializações. As bases distilled do 2.3 treinaram um pouco mais rápido.
  • Nuvem: Se você aluga, preveja $0,80–$1,60/hora para uma GPU de classe 24 GB em março de 2026. Isso coloca um único retreinamento limpo na faixa de $3–$10, mais seu tempo. Obviamente, conjuntos maiores e mais experimentação aumentam isso.

Não me economizou tempo no início. Mas após duas ou três execuções, meus LoRAs do 2.3 precisaram de menos salvaguardas nos prompts, o que reduziu o esforço mental nos lotes futuros.

Usuários de API: Diferenças de Endpoint e Parâmetros a Observar

Para APIs gerenciadas, as diferenças entre ltx-2.3 e ltx-2 foram pequenas, mas consequentes:

  • Modelos versionados: O 2.3 frequentemente fica atrás de um parâmetro explícito de modelo ou versão. Se você depende de “latest”, bloqueie em 2.0 até terminar os testes.
  • Padrões mudaram: Guidance, contagens de etapas e níveis de segurança mudaram no meu provedor. Meus presets do LTX-2 produziram imagens com contraste mais alto no 2.3 até eu reduzir o CFG em ~10–15%.
  • Tipos de seed: Uma API mudou seeds de inteiros de 32 bits para 64 bits com o 2.3. Inofensivo, exceto que meu wrapper antigo tipava seeds como strings. Ele as ignorava silenciosamente.
  • Prompts negativos e sintaxe de pesos: Verifique a formatação do tokenizador/peso. Um provedor apertou o parsing: minha antiga sintaxe “(keyword:1.2)” precisava de espaçamento para ser registrada.
  • Limites de taxa e batching: O 2.3 rodou um pouco mais rápido por requisição nas minhas filas, mas os limites de concorrência em lote não mudaram. Escalonei os jobs para evitar picos curtos.

Se você está em dúvida, dê uma olhada nas notas de versão do seu provedor e teste o mesmo prompt/seed entre as versões. Espere composição similar, não pixels idênticos.

Quando Faz Sentido Continuar no LTX-2

Gosto de novidades tanto quanto qualquer pessoa, mas não reconstruo sistemas funcionando sem um motivo. Continuei no LTX-2 para alguns projetos porque:

  • Você precisa de reprodutibilidade estrita. Mesma seed, mesmos pixels, para auditorias, fluxos de trabalho regulamentados, ou aprovações de clientes vinculadas a uma versão anterior do modelo.
  • Você tem investimentos pesados em LoRA. Se sua biblioteca é profunda e diversificada, o custo do retreinamento (tempo, atenção, não só dinheiro) se acumula.
  • Restrições de borda ou pouca VRAM. Se sua máquina com 8 GB mal sustenta o stack 2.0, as necessidades extras de memória do 2.3 podem te empurrar para offloading.
  • Custo de treinamento da equipe. Se prompts e presets estão integrados em docs e tutoriais, o 2.3 forçará pequenas, mas cumulativas mudanças. Morte por mil cortes é real.

Por outro lado, se você está começando do zero ou gosta de maior aderência ao prompt logo de cara, o 2.3 pareceu mais fácil de conduzir.

Checklist de Decisão de Atualização (ComfyUI / API gerenciada)

Aqui está o que eu realmente percorri antes de mudar um pipeline.

ComfyUI

  • Duplique o grafo e troque pelo LTX-2.3 com um nó loader limpo. Não sobrescreva seu caminho 2.0.
  • Redefina seu par etapas/CFG. Comece em ~80% das suas etapas antigas e reduza o CFG em 0,5–1,0.
  • Valide seeds em 5–10 prompts que você se importa. Aceite similaridade de composição, não identidade de pixels.
  • Verifique estágios de alta resolução/tiling para OOMs. Se estiver apertado, tente fp8 ou menor sobreposição.
  • Desative os LoRAs, depois reative um por vez. Se se comportar mal, planeje um retreinamento em vez de hackear os pesos.
  • Atualize quaisquer templates de prompt negativo. Reduza se os resultados parecerem mais limpos: não carregue bagagem desnecessária.

API gerenciada

  • Fixe a versão do modelo explicitamente durante os testes.
  • Recrie seu preset com CFG e etapas reduzidos, depois compare saída/latência.
  • Confirme o tratamento de seed (largura de bits, tipos) na documentação.
  • Verifique flags de segurança e filtros de conteúdo: você pode precisar relaxar ou elevar os limiares.
  • Execute um pequeno lote lado a lado (2.0 vs 2.3) e deixe um humano escolher os vencedores para seu caso de uso. Confie nos olhos, não nas métricas.

Se a maioria das caixas continuar verde após um dia de testes leves, eu faço a atualização. Se duas ou mais precisarem de fita adesiva, espero.

Perguntas Frequentes

Os LoRAs do LTX-2 funcionam no LTX-2.3 sem retreinamento?

Nos meus testes, não de forma confiável. O modelo base muda o suficiente para que os estilos derivem ou colapsem. Você pode conseguir resultados aceitáveis com pesos muito suaves, mas é frágil. Trate o 2.3 como uma nova base e planeje um novo passo de LoRA.

Os checkpoints do LTX-2 e do LTX-2.3 podem coexistir na mesma configuração do ComfyUI?

Sim. Mantenha-os em pastas separadas, atualize os caminhos do nó Checkpoint Loader e nomeie seus presets com versão. Também adiciono a tag do modelo no nome do arquivo de saída para que imagens antigas não se misturem. É mundano, mas te salva no futuro.

Termino com uma pequena observação: a primeira imagem do 2.3 que me fez pausar foi uma simples foto de produto numa prateleira. As linhas da prateleira estavam finalmente retas. Não dramático, só uma coisa a menos para corrigir depois. É assim que uma boa atualização costuma parecer.

Posts Anteriores:

Compartilhar