NVFP4 vs NVFP8 para LTX-2: Comparación de Velocidad, Calidad y VRAM (Guía RTX)

No necesité buscar configuraciones de precisión. Me las encontré porque LTX-2 seguía empujando mi GPU de 16 GB al límite durante un render en lote. La vista previa se congeló, mi ventilador rugió, y ese pequeño desplegable, NVFP4 o NVFP8, de repente dejó de parecer una opción de nicho para convertirse en una forma de llegar al final del día.

Durante la última semana (enero de 2026), probé LTX-2 con NVFP4 y NVFP8 en algunos escenarios simples y aburridos: clips cortos en 1080p y 2K para pases conceptuales, y un par de planos estáticos en 4K y panorámicas para tablas de referencias de clientes. Nada heroico, ya sabes. Solo el tipo de trabajo que se acumula. Aquí está lo que noté, lo que funcionó, y dónde cada configuración ayudó silenciosamente, o se metió en el camino.

NVFP4 vs NVFP8 Explicado (resumen de una frase)

NVFP4 intercambia un poco de calidad y estabilidad por menos VRAM y mayor rendimiento: NVFP8 mantiene mejor los detalles pero exige más de tu GPU.

Matriz de Compensación Velocidad / VRAM / Calidad

Lo mantendré simple porque la realidad es simple.

Velocidad: NVFP4 fue generalmente 15–30% más rápido en mis ejecuciones, dependiendo de la resolución y el tamaño del lote: NVFP8 se ralentizó un poco pero se mantuvo consistente.
VRAM: NVFP4 redujo la huella de memoria en aproximadamente 25–40% para mí: NVFP8 usó más pero redujo artefactos.
Calidad: NVFP8 mantuvo bordes nítidos (cabello, señalización, microtexturas) y redujo el centelleo en movimiento: NVFP4 suavizó detalles y a veces agregó pequeña oscilación temporal.

Esa es la forma de ello. El resto es situacional.

Algunas notas de campo de pruebas repetibles en un RTX 4090 (24 GB) y un 4080 (16 GB):

1080p, clips cortos (4–6s): NVFP4 mantuvo la vista previa suave y me permitió aumentar tamaños de lotes: NVFP8 mantuvo rostros y tipo más limpios fotograma a fotograma.
2K, clips medianos (8–12s): NVFP4 fue bien para primeros pases: NVFP8 evitó el pequeño “arrastre” en texturas durante panorámicas.
4K, planos estáticos: NVFP8 valió la pena. Prefería esperar un poco que pasar tiempo retocando bordes.

Nada de esto fue dramático. Pero lo sentí. Menos presión de VRAM con NVFP4 significó menos interrupciones. Salida más limpia con NVFP8 significó menos repeticiones.

Cuándo Usar NVFP4 (producción en lote / poco VRAM)

Recurro a NVFP4 cuando me importa más el flujo que el acabado.

Dónde NVFP4 ayudó

Pases conceptuales en lote: Podía ejecutar 3–6 prompts en paralelo a 1080p en 16 GB sin jugar con la memoria. Eso significaba que permanecía en el flujo y comparaba opciones antes.
Pases ásperos y animáticos: Para tableros rápidos con planos de marcadores de posición, la suavidad leve no importaba. Incluso ocultaba rarezas.
Sesiones largas: Espacio de cabecera VRAM significaba menos reinicios. Menos fricción se suma durante un día.

Compromisos que realmente noté

Pérdida de microdetalle: Los patrones finos (malla, tipo de línea capilar, pequeños reflejos) se atenuaron ligeramente. No roto, solo menos nítido.
Estabilidad temporal: En panorámicas lentas, NVFP4 a veces introdujo un pequeño parpadeo en áreas de alta frecuencia. No siempre fue obvio en la línea de tiempo, pero apareció en pausa.

Rangos prácticos que se sintieron seguros para mí

1080p, clips cortos: NVFP4 con tamaños de lote modestos (2–4) se mantuvo bien por debajo de 16 GB.
2K, clips cortos: NVFP4 mantuvo las cosas suaves en 16 GB si no presionaba demasiado la longitud del contexto.

Por qué usarlo: NVFP4 es una buena “precisión de pensamiento”. Reduce el costo de explorar ideas. Si la salida es solo para ti o una revisión de equipo, NVFP4 hace que LTX-2 se sienta ligero.

Cuándo Usar NVFP8 (calidad / detalles finos)

Cambio a NVFP8 cuando estoy cerrando el bucle.

Dónde NVFP8 valió la pena

Fotogramas finales para presentaciones: Si un fotograma podría viajar, compartir con cliente, cartera o redes sociales, NVFP8 redujo la limpieza.
Rostros y manos: Los bordes se mantuvieron mejor, y la pequeña oscilación alrededor de pestañas/línea capilar se calmó.
Tipo y señalización: No perfecto, pero más legible a menudo. Menos re-renders solo para arreglar una letra temblorosa.

Costos a aceptar

VRAM más pesado: En 16 GB, mantuve tamaños de lote bajos en 2K y evité apilar nodos extra en el mismo gráfico.
Un poco más lento: No me importó la espera porque ejecutaba NVFP8 solo después de que me gustaba el plano.

Si tocas 4K incluso para planos estáticos, NVFP8 es el predeterminado más seguro. Intenté ahorrar tiempo con NVFP4 una vez en 4K: pasé ese tiempo de vuelta en post limpiando bordes.

Tabla de Configuración por Resolución (1080p / 2K / 4K)

Estas no son reglas. Son lo que me mantuvo en movimiento sin constante ajustes. El hardware importa. Esto fue en:

RTX 4080 16 GB (escritorio)
RTX 4090 24 GB (máquina de estudio)

Definiciones:

“Lote” aquí = prompts o clips paralelos dentro de una ejecución de gráfico.
“Contexto/longitud” = cuánto tiempo se ejecuta tu secuencia o cuánto acondicionamiento empaquetas.

1080p (1920×1080)

16 GB: NVFP4, lote 3–4, clips cortos (≤6s) se sienten seguros: NVFP8, lote 2, estable.
24 GB: NVFP4, lote 6–8 fácil: NVFP8, lote 3–4 con espacio para extras.

2K (2048×1152 o 2048×1536)

16 GB: NVFP4, lote 2–3: NVFP8, lote 1–2: mantén contexto moderado.
24 GB: NVFP4, lote 4: NVFP8, lote 2–3, observa el apilamiento de nodos.

4K (3840×2160)

16 GB: NVFP4, solo individuales, contextos cortos: NVFP8, individuales, sé paciente.
24 GB: NVFP4, lote 2 en un gráfico magro: NVFP8, individual o lote 2 si otros nodos son ligeros.

Señales de que estás presionando:

Picos de VRAM al raspar o cambiar semillas durante la ejecución.
La salida comienza bien pero se degrada en fotogramas posteriores.
La vista previa de ComfyUI pausa más tiempo entre fotogramas de lo habitual.

Si encuentras cualquiera de esos, primero reduce el tamaño del lote. Luego acorta la secuencia. La precisión es generalmente la última palanca que tiro.

Cómo Cambiar Precisión en ComfyUI

Esto depende un poco del paquete de nodos que estés usando, pero aquí está lo que he visto (enero de 2026):

Cargador de modelo o nodo LTX-2: generalmente hay un desplegable de Precisión o Dtype. He visto opciones como NVFP4, NVFP8 y float16. Lo cambio allí y mantengo el resto del gráfico sin cambios.
Si no hay desplegable: consulta la documentación del nodo o el readme del repo. Algunas compilaciones heredan la configuración de un config global o una bandera de entorno.
Gráficos mixtos: si estás encadenando LTX-2 con escaladores o nodos de post, mantén un ojo en los desajustes de dtype. La mayoría de nodos convierten automáticamente, pero a veces pagas un impuesto de memoria oculto.

Lo que funcionó para mí

Guarda dos versiones del mismo gráfico: una llamada _fp4 para exploración, una _fp8 para finales. De esa manera no estoy buscando un interruptor.
Mantén la vista previa habilitada en pases NVFP4. Si la vista previa se entrecorta, generalmente es una señal de que mi lote o contexto es demasiado alto incluso para fp4.

Si quieres especificidades, la documentación oficial o el repo del nodo a menudo explican cómo se pasa la bandera de precisión. Verifico esos cruzados cuando algo se siente mal.

Prueba Ambos en WaveSpeed

No confié en mis ojos solo, así que me apoyé en un bucle simple: mismo prompt, misma semilla, dos ejecuciones, una en NVFP4, una en NVFP8, cronometradas con un pequeño flujo de WaveSpeed y un cronómetro al lado. Me importa menos los números exactos y más la forma de la diferencia.

Lo que medí (aproximadamente)

Rendimiento: NVFP4 consistentemente terminó 15–30% más rápido en mi caja de 16 GB: más cercano al 20% en la caja de 24 GB.
Espacio de cabecera VRAM: NVFP4 me dejó 2–4 GB extra en 1080p, lo que me permitió mantener un nodo de denoise ligero activo. NVFP8 comió ese margen.
Efectos visuales: en una panorámica lenta a través de ladrillo y follaje, NVFP8 mantuvo textura. NVFP4 emborronó un poco y agregó un pequeño centelleo. En clips con mucho movimiento, apenas lo noté.

WaveSpeed (o cualquier dispositivo de referencia que uses) me ayuda a mantenerme honesto. Ejecuto tres pares y descarto el primero como calentamiento. Luego me hago una pregunta aburrida: ¿esta configuración me ahorró pasos? Si la respuesta es sí, se mantiene.

Si quieres comparar NVFP4 y NVFP8 sin jugar con límites de VRAM locales, WaveSpeed te permite ejecutar los mismos prompts y semillas de LTX-2 en GPUs en la nube más grandes. Es una forma directa de verificar velocidad, espacio de cabecera de memoria, y compensaciones visuales antes de bloquear configuraciones. Quién podría preferir cuál:

Si estás haciendo storyboards, prototipando características, o produciendo conceptos para redes sociales a volumen, NVFP4 se empareja bien con plazos.
Si estás entregando fotogramas que serán pausados, ampliados, o listos para impresión, NVFP8 se justifica.

No afirmaré que uno es mejor. Son diferentes marchas. Cambio mucho menos ahora que he nombrado cuándo cada uno ayuda.

Una pequeña nota que mantengo en la esquina de mi cuaderno: cuando un render se siente “ruidoso” para juzgar, generalmente no es un problema de precisión, es un problema de expansión de configuraciones. Corto variables primero, luego alterna NVFP4/NVFP8.

Aquí es donde lo dejaré. Ayer, NVFP8 me ahorró una hora que habría pasado limpiando bordes en un plano estático en 4K. Esta mañana, NVFP4 me permitió previsualizar cuatro looks a la vez sin que el ventilador sonara como un despegue. No necesito más que eso.