← Blog

De LTX-2 a LTX-2.3: Compatibilidad, Cambios en LoRA y Migración (2026)

¿Ya usas LTX-2? Aquí tienes qué se rompe, qué cambia y qué verificar antes de actualizar a LTX-2.3 — incluyendo tamaño del modelo, nodos de ComfyUI, compatibilidad con LoRA y diferencias en la API.

12 min read
De LTX-2 a LTX-2.3: Compatibilidad, Cambios en LoRA y Migración (2026)

Hola, soy Dora. No planifiqué una semana de actualizaciones. Solo quería volver a ejecutar un prompt antiguo de una presentación de cliente. Misma semilla, misma configuración, supuestamente “el mismo” modelo, excepto que no lo era. LTX-2.3 llegó a mi carpeta, y las imágenes se sentían un poco más limpias, un poco más literales… y mi estilo mejorado con LoRA había desaparecido. Ese pequeño desajuste me llevó por la madriguera del conejo. Durante unos días en marzo de 2026, probé la actualización de ltx-2 a ltx-2.3 en mis pipelines habituales de ComfyUI y la API administrada en la que me apoyo para trabajo por lotes. Esto es lo que realmente cambió, lo que se mantuvo estable, y dónde aparece la fricción cuando haces trabajo real, no demos.

Qué Cambió Realmente Entre LTX-2 y 2.3

Me saltaré las afirmaciones de marketing y me quedaré con las partes que afectaron mis flujos de trabajo existentes.

  • Los prompts se resuelven de forma más literal. Noté que 2.3 sigue las indicaciones posicionales (“izquierda/derecha”, “primer plano/fondo”) de manera más consistente. Bueno para composiciones de productos: un poco rígido para prompts artísticos que dependían de la flexibilidad de LTX-2.
  • El contraste y la saturación son más altos por defecto. Mis presets de iluminación neutral salieron más intensos en 2.3. Bajé la guía ~0.5–1.0 y reduje el contraste en postprocesado con menos frecuencia.
  • Las semillas no son 1:1 entre versiones. Incluso con la misma semilla, LTX-2.3 divergió después de ~10–12 pasos en mis ejecuciones. Si necesitas re-renders estables a nivel de píxel de trabajos antiguos, no cuentes con ello.
  • El manejo de relaciones de aspecto es más sensato. 2.3 respetó tamaños no cuadrados (p. ej., 1024×1536) con menos elementos distorsionados. Pude eliminar algunos de los trucos de lienzo que usaba en LTX-2.
  • Los valores predeterminados del sampler cambiaron. El scheduler recomendado en 2.3 (y su curva de pasos) me llevó a usar menos pasos para el mismo nivel de detalle. Mi punto óptimo pasó de ~28–32 pasos a ~22–26. El rendimiento mejoró un poco con la misma GPU.

Nada de esto es dramático. Pero es suficiente para doblar un pipeline de formas pequeñas, a veces bienvenidas… y para romper cualquier cosa que dependa de la reproducibilidad exacta, especialmente los LoRAs.

Verificación de la Realidad del Tamaño del Modelo: Implicaciones para la Implementación Local

Ejecuté ambas versiones en una 4090 de 24 GB y en una GPU de laptop de 8 GB. Esta es la parte que desearía que las notas de versión enfatizaran más: el techo práctico de lo que tu tarjeta puede sostener y aún funcionar con fluidez.

Comparación de VRAM y Almacenamiento (dev / fp8 / destilado en ambas versiones)

Esto es lo que observé y lo que importó en la práctica:

  • Checkpoints dev/completos: En la 4090, tanto las compilaciones “dev” de LTX-2 como de LTX-2.3 se cargaron, pero 2.3 ocupó un poco más de VRAM en tiempo de ejecución (aproximadamente +0.5–1.2 GB en mis ejecuciones con el mismo sampler/pasos). Si tienes poco margen para generaciones de alta resolución, ese margen importa. En la tarjeta de 8 GB, las compilaciones dev completas no eran realistas sin offloading.
  • Variantes FP8/cuantizadas: La compilación fp8 de 2.3 liberó ~25–35% de VRAM versus precisión completa en mis pruebas, a costa de detalles finos ligeramente más frágiles al usar muy pocos pasos. Para salidas 1K cotidianas, no me importó. Si compositas o recortas agresivamente, puede que sí. Para las ventajas prácticas de la cuantización FP8 en implementación, consulté la guía oficial de NVIDIA sobre entrenamiento de IA eficiente con menor precisión.
  • Destilado: El checkpoint destilado de 2.3 se comportó como un punto intermedio práctico. Menor huella de almacenamiento, arranques en caliente notablemente más rápidos, pequeña compensación en micro-detalles de bordes. Para imágenes listas para redes sociales y documentos internos, elegiría el 2.3 destilado sobre el 2.0 completo.
  • Huella en disco: Espera un leve aumento para las variantes de 2.3 versus 2.0. No es enorme, pero necesité eliminar LoRAs experimentales antiguos para mantener limpia la unidad de trabajo.

Una pequeña nota desde las trincheras: una vez que el margen de VRAM bajó de ~2 GB restantes, vi errores OOM ocasionales durante pasadas de alta resolución en mosaico con 2.3. Reducir la superposición de mosaicos o usar fp8 lo estabilizó.

Compatibilidad de Flujos de Trabajo en ComfyUI: Qué Sigue Funcionando, Qué Necesita Actualización

Mantuve mi configuración de ComfyUI mayormente intacta e intercambié los checkpoints. Consulté principalmente el repositorio oficial de ComfyUI para garantizar la compatibilidad del flujo de trabajo durante mis pruebas.

Lo que siguió funcionando sin problemas:

  • Grafos básicos de texto a imagen con condicionamiento → sampler → decodificación VAE. Pude cambiar al loader 2.3 y renderizar sin reconstruir el grafo.
  • Los samplers comunes (p. ej., familias DPM++) funcionaron bien. Solo ajusté los pasos y la guía para adaptarme a la nueva curva.
  • Los flujos de trabajo de alta resolución con upscalers latentes siguieron funcionando, aunque acorté los pasos de la segunda etapa en ~20% sin perder detalle.

Lo que necesitó actualizaciones:

  • Nodos de inyección de LoRA: Mis LoRAs de LTX-2 no se adjuntaron correctamente a 2.3. Incluso cuando el nodo me permitía conectar, los resultados eran incorrectos; el estilo se desviaba o colapsaba. Más sobre esto a continuación.
  • Rutas y formatos de checkpoints: Los checkpoints de 2.3 que probé venían con nombres de carpeta diferentes y una referencia de configuración ligeramente diferente. Tuve que actualizar las rutas del nodo Checkpoint Loader y confirmar el emparejamiento de VAE.
  • Valores predeterminados de parámetros: Mis presets “de casa” antiguos (CFG 6.5, pasos ~30) produjeron un contraste más duro en 2.3. Bajar CFG a ~5.5 y pasos a ~24 restauró el equilibrio que me gustaba.
  • Prompts negativos: Dependí menos de listas negativas largas. 2.3 parecía evitar ciertos artefactos de forma nativa (las manos mejoraron un poco en mis poses de producto). Recorté los negativos para reducir la sobrecarga del prompt.

Cambios en Nodos, Rutas de Checkpoints y Diferencias de Parámetros

  • Cambios en nodos: No necesité nuevos nodos personalizados para la generación básica, pero sí actualicé mi nodo de carga de modelos a una compilación más reciente de ComfyUI para evitar discrepancias en los metadatos. Si estás unos meses atrasado en ComfyUI, actualiza primero; te ahorra errores extraños.
  • Rutas de checkpoints: Mantén separadas las carpetas de 2.0 y 2.3. Uso un esquema de nomenclatura claro (nombre_modelo/versión/precisión) para que los trabajos por lotes no tomen el archivo equivocado.
  • Diferencias de parámetros: 2.3 parecía más sensible a los cambios de CFG. Cambios pequeños (~0.5) tenían un mayor impacto visual que en 2.0. Además, menos pasos daban un detalle similar: superar ~26 en imágenes 1K generaba rendimientos decrecientes en mis pruebas.

Compatibilidad de LoRA: Por Qué los LoRAs Existentes No Se Transferirán Directamente

Esta fue la mayor sorpresa, y la más costosa si has construido una biblioteca de estilos en LTX-2.

Mis LoRAs de LTX-2 no se transfirieron de manera significativa. La versión corta: los cambios en el modelo base (espacio de embeddings, bloques de atención, a veces normalización y cambios en el VAE) significan que los deltas aprendidos no se mapean limpiamente. Puedes forzarlo, pero lucharás con dominantes de color extrañas, deriva de formas, o el temido “todo se convierte en plástico beige”. Si tu estilo depende heavily de los LoRAs, se recomienda tratar LTX-2.3 como un nuevo modelo base y reentrenar siguiendo la guía oficial de entrenamiento de LoRA de Hugging Face.

Desde un ángulo práctico: si tu look depende de LoRAs, espera tratar LTX-2.3 como una nueva base y reentrenar.

Qué Necesitas Reentrenar y Costo Estimado

Lo que conservé:

  • Dataset: Reutilicé mi conjunto limpio con subtítulos (alrededor de 300–800 imágenes por estilo, dependiendo de la variedad). Mejores subtítulos ayudaron más en 2.3 que el volumen bruto.
  • Configuración: Tasas de aprendizaje más bajas que las que usé para 2.0 para evitar saturar el entrenamiento. El rango/dim se mantuvo similar, pero reduje los pasos de entrenamiento en ~10–15%.
  • Validación: Validé cada pocos cientos de pasos con los nuevos prompts base, no los legacy. Los prompts antiguos me sesgaban hacia los objetivos equivocados.

Costos, en términos humanos aproximados:

  • Tiempo: Aproximadamente 3–5 horas por LoRA en una sola 4090 para conjuntos de tamaño mediano, incluyendo validación y pequeños reinicios. Las bases destiladas de 2.3 entrenaron notablemente más rápido.
  • Nube: Si alquilas, presupuesta $0.80–$1.60/hora para una GPU de clase 24 GB a partir de marzo de 2026. Eso pone un reentrenamiento limpio en el rango de $3–$10, más tu tiempo. Obviamente, conjuntos más grandes y más experimentación lo incrementan.

No me ahorró tiempo al principio. Pero después de dos o tres ejecuciones, mis LoRAs de 2.3 necesitaron menos restricciones en los prompts, lo que redujo el esfuerzo mental en futuros lotes.

Usuarios de API: Diferencias de Endpoints y Parámetros a Tener en Cuenta

Para las APIs administradas, las diferencias entre ltx-2.3 y ltx-2 fueron pequeñas pero consecuentes:

  • Modelos versionados: 2.3 a menudo se encuentra detrás de un parámetro explícito de modelo o versión. Si dependes de “latest”, bloquéalo en 2.0 hasta que termines las pruebas.
  • Los valores predeterminados cambiaron: La guía, los conteos de pasos y los niveles de seguridad cambiaron en mi proveedor. Mis presets de LTX-2 produjeron imágenes de mayor contraste en 2.3 hasta que bajé el CFG en ~10–15%.
  • Tipos de semilla: Una API cambió las semillas de enteros de 32 bits a 64 bits con 2.3. Inofensivo, excepto que mi wrapper antiguo tipificaba las semillas como strings. Las ignoraba silenciosamente.
  • Prompts negativos y sintaxis de pesos: Verifica el formato de tokenizer/peso. Un proveedor ajustó el análisis: mi antigua sintaxis “(keyword:1.2)” necesitaba espaciado para registrarse.
  • Límites de tasa y procesamiento por lotes: 2.3 se ejecutó ligeramente más rápido por solicitud en mis colas, pero los límites de concurrencia por lotes no cambiaron. Escaloné los trabajos para evitar picos cortos.

Si tienes dudas, revisa las notas de versión de tu proveedor y prueba el mismo prompt/semilla entre versiones. Espera una composición similar, no píxeles idénticos.

Cuándo Tiene Sentido Quedarse en LTX-2

Me gustan los juguetes nuevos tanto como a cualquiera, pero no reconstruyo sistemas que funcionan sin una razón. Me quedé en LTX-2 para algunos proyectos porque:

  • Necesitas reproducibilidad estricta. Misma semilla, mismos píxeles, para auditorías, flujos de trabajo regulados, o aprobaciones de clientes vinculadas a una versión anterior del modelo.
  • Tienes inversiones pesadas en LoRA. Si tu biblioteca es profunda y diversa, el costo de reentrenamiento (tiempo, atención, no solo dinero) se acumula.
  • Restricciones de edge o VRAM bajo. Si tu máquina de 8 GB apenas sostiene el stack de 2.0, las necesidades de margen adicional de 2.3 pueden llevarte al offloading.
  • Costo de capacitación del equipo. Si los prompts y presets están incorporados en documentos y tutoriales, 2.3 forzará cambios pequeños pero acumulativos. La muerte por mil cortes es real.

Por otro lado, si estás comenzando desde cero o te gusta una adherencia de prompt más estricta desde el principio, 2.3 se sentía más fácil de guiar.

Lista de Verificación para la Decisión de Actualización (ComfyUI / API administrada)

Esto es lo que realmente recorrí antes de cambiar un pipeline.

ComfyUI

  • Duplica el grafo e intercambia con LTX-2.3 usando un nodo loader limpio. No sobreescribas tu ruta de 2.0.
  • Encuentra de nuevo tu par de pasos/CFG. Comienza con ~80% de tus pasos anteriores y baja el CFG en 0.5–1.0.
  • Valida las semillas en 5–10 prompts que te importen. Acepta similitud de composición, no identidad de píxeles.
  • Verifica las etapas de alta resolución/mosaico por OOMs. Si está ajustado, prueba fp8 o reduce la superposición.
  • Desactiva los LoRAs, luego reactívalos uno a la vez. Si se comporta mal, planifica un reentrenamiento en lugar de hackear los pesos.
  • Actualiza las plantillas de prompts negativos. Recorta si los resultados se ven más limpios: no cargues con bagaje innecesario.

API administrada

  • Fija la versión del modelo explícitamente durante las pruebas.
  • Recrea tu preset con CFG y pasos reducidos, luego compara la salida/latencia.
  • Confirma el manejo de semillas (ancho de bits, tipos) en la documentación.
  • Verifica los indicadores de seguridad y los filtros de contenido: es posible que necesites relajar o elevar los umbrales.
  • Ejecuta un pequeño lote en paralelo (2.0 vs 2.3) y que un humano elija los ganadores para tu caso de uso. Confía en los ojos más que en las métricas aquí.

Si la mayoría de los puntos siguen en verde después de un día de pruebas ligeras, actualizo. Si dos o más necesitan cinta adhesiva, espero.

Preguntas Frecuentes

¿Funcionan los LoRAs de LTX-2 en LTX-2.3 sin reentrenamiento?

En mis pruebas, no de manera confiable. El modelo base cambia lo suficiente como para que los estilos se desvíen o colapsen. Es posible que obtengas resultados pasables con pesos muy suaves, pero es frágil. Trata 2.3 como una nueva base y planifica una nueva pasada de LoRA.

¿Pueden coexistir los checkpoints de LTX-2 y LTX-2.3 en la misma configuración de ComfyUI?

Sí. Mantenlos en carpetas separadas, actualiza las rutas del nodo Checkpoint Loader y ponle versión a tus presets. También etiqueto las salidas con el modelo en el nombre de archivo para que las imágenes antiguas no se mezclen. Es mundano, pero te salva en el futuro.

Terminaré con una pequeña nota: la primera imagen de 2.3 que me hizo pausar fue una simple toma de producto en estante. Las líneas del estante finalmente estaban rectas. No dramático, solo una cosa menos que corregir después. Así es como generalmente se sienten las buenas actualizaciones.

Artículos Anteriores: