NVFP4 vs NVFP8 pour LTX-2 : Comparaison de la vitesse, qualité et VRAM (Guide RTX)

Je n’étais pas à la recherche de paramètres de précision. Je les ai découverts parce que LTX-2 poussait constamment mon GPU de 16 Go aux limites pendant un rendu par lot. L’aperçu s’est figé, mon ventilateur a rugit, et cette petite liste déroulante, NVFP4 ou NVFP8, semblait soudain moins être une option de niche et plus une façon de passer la journée.

Au cours de la dernière semaine (janvier 2026), j’ai testé LTX-2 avec NVFP4 et NVFP8 dans quelques scénarios réguliers et ennuyeux : des clips courts en 1080p et 2K pour les passes de concept, et quelques visuels et panoramiques en 4K pour les moodboards clients. Rien d’héroïque, vous savez. Juste le genre de travail qui s’accumule. Voici ce que j’ai remarqué, ce qui a fonctionné et où chaque paramètre a discrètement aidé ou fait obstacle.

NVFP4 vs NVFP8 Expliqué (résumé en une phrase)

NVFP4 échange un peu de qualité et de stabilité pour moins de VRAM et un débit plus rapide : NVFP8 préserve mieux les détails mais demande plus à votre GPU.

Matrice de compromis Vitesse / VRAM / Qualité

Je vais garder cela simple parce que la réalité est simple.

Vitesse : NVFP4 était généralement 15–30 % plus rapide dans mes essais, selon la résolution et la taille du lot : NVFP8 a ralenti un peu mais est resté constant.
VRAM : NVFP4 a réduit l’empreinte mémoire d’environ 25–40 % pour moi : NVFP8 a utilisé plus mais a réduit les artefacts.
Qualité : NVFP8 a préservé les bords nets (cheveux, signalétique, microtextures) et a réduit le scintillement en mouvement : NVFP4 a adouci les détails et a parfois ajouté une légère instabilité temporelle.

C’est la forme générale. Le reste est situationnel.

Quelques notes de terrain d’essais reproductibles sur une RTX 4090 (24 Go) et une 4080 (16 Go) :

1080p, clips courts (4–6s) : NVFP4 a gardé l’aperçu fluide et m’a permis d’augmenter les tailles de lot : NVFP8 a gardé les visages et le texte plus nets d’une image à l’autre.
2K, clips moyens (8–12s) : NVFP4 a convenu pour les premières passes : NVFP8 a évité le léger « rampement » sur les textures lors du panoramique.
4K, visuels : NVFP8 en valait la peine. Je préférais attendre un peu plutôt que de passer du temps à retoucher les bords.

Rien de tout cela n’était dramatique. Mais je l’ai senti. Moins de pression sur le VRAM avec NVFP4 signifiait moins d’interruptions. Une sortie plus nette avec NVFP8 signifiait moins de recommencements.

Quand utiliser NVFP4 (production par lot / VRAM faible)

Je me tourne vers NVFP4 quand je me soucie davantage du flux que de la finition.

Où NVFP4 a aidé

Passes de concept par lot : J’ai pu lancer 3–6 invites en parallèle en 1080p sur 16 Go sans jongler avec la mémoire. Cela signifiait que je restais dans le flux et que je comparais les options plus tôt.
Brouillons et animatiques rapides : Pour des moodboards rapides avec des plans d’espace réservé, la légère douceur n’avait pas d’importance. Cela a en fait masqué les bizarreries.
Longues sessions : L’espace supplémentaire en VRAM signifiait moins de redémarrages. Moins de friction s’accumule au cours de la journée.

Compromis que j’ai réellement remarqués

Perte de micro-détails : Les motifs fins (maille, contour des cheveux, petits reflets) se sont légèrement estompés. Pas cassés, juste moins nets.
Stabilité temporelle : Sur des panoramiques lents, NVFP4 a parfois introduit un léger scintillement dans les zones de haute fréquence. Ce n’était pas toujours évident dans la chronologie, mais c’est apparu à la pause.

Plages pratiques qui me semblaient sûres

1080p, clips courts : NVFP4 avec des tailles de lot modestes (2–4) restait bien en dessous de 16 Go.
2K, clips courts : NVFP4 a gardé les choses fluides sur 16 Go si je ne poussais pas trop la longueur du contexte.

Pourquoi l’utiliser : NVFP4 est une bonne « précision réfléchie ». Elle réduit le coût de l’exploration des idées. Si la sortie est juste pour vous ou un contrôle d’équipe, NVFP4 rend LTX-2 léger.

Quand utiliser NVFP8 (qualité / détails fins)

Je bascule vers NVFP8 quand je ferme la boucle.

Où NVFP8 en valait la peine

Cadres finaux pour les présentations : Si un cadre pourrait voyager, partage client, portfolio ou réseaux sociaux, NVFP8 a réduit le nettoyage.
Visages et mains : Les bords se tenaient mieux, et la petite nervosité autour des cils/de la racine des cheveux s’est stabilisée.
Texte et signalétique : Pas parfait, mais plus lisible souvent. Moins de re-rendus juste pour corriger une lettre tremblante.

Coûts à accepter

VRAM plus lourd : Sur 16 Go, j’ai gardé les tailles de lot basses en 2K et j’ai évité d’empiler des nœuds supplémentaires dans le même graphe.
Un peu plus lent : Je n’ai pas dérangé l’attente parce que j’ai exécuté NVFP8 seulement après avoir aimé le plan.

Si vous touchez 4K même pour des visuels, NVFP8 est la valeur par défaut plus sûre. J’ai essayé une fois d’économiser du temps avec NVFP4 en 4K : j’ai repris ce temps en post-production en nettoyant les bords.

Tableau de configuration par résolution (1080p / 2K / 4K)

Ce ne sont pas des règles. C’est ce qui m’a gardé en mouvement sans bricolage constant. Le matériel compte. C’était sur :

RTX 4080 16 Go (bureau)
RTX 4090 24 Go (machine studio)

Définitions :

« Lot » ici = invites ou clips parallèles dans une exécution de graphe.
« Contexte/longueur » = la durée de votre séquence ou la quantité de conditionnement que vous regroupez.

1080p (1920×1080)

16 Go : NVFP4, lot 3–4, clips courts (≤6s) se sentent sûrs : NVFP8, lot 2, stable.
24 Go : NVFP4, lot 6–8 facile : NVFP8, lot 3–4 avec de la place pour des extras.

2K (2048×1152 ou 2048×1536)

16 Go : NVFP4, lot 2–3 : NVFP8, lot 1–2 : gardez le contexte modéré.
24 Go : NVFP4, lot 4 : NVFP8, lot 2–3, surveillez l’empilement des nœuds.

4K (3840×2160)

16 Go : NVFP4, individuels seulement, contextes courts : NVFP8, individuels, soyez patient.
24 Go : NVFP4, lot 2 dans un graphe épuré : NVFP8, individuel ou lot 2 si les autres nœuds sont légers.

Signes que vous la forcez :

Les pics de VRAM lors du scrubbing ou de la modification des graines en cours d’exécution.
La sortie commence bien mais se dégrade dans les images ultérieures.
L’aperçu ComfyUI fait une pause plus longue entre les images que d’habitude.

Si vous rencontrez l’un de ces problèmes, baissez d’abord la taille du lot. Puis raccourcissez la séquence. La précision est généralement le dernier levier que j’actionne.

Comment changer la précision dans ComfyUI

Cela dépend un peu du pack de nœuds que vous utilisez, mais voici ce que j’ai vu (janvier 2026) :

Chargeur de modèle ou nœud LTX-2 : il y a généralement une liste déroulante Précision ou Dtype. J’ai vu des options comme NVFP4, NVFP8 et float16. Je la bascule là et je garde le reste du graphe inchangé.
S’il n’y a pas de liste déroulante : consultez la documentation du nœud ou le readme du repo. Certaines versions héritent du paramètre d’une configuration globale ou d’un drapeau d’environnement.
Graphes mixtes : si vous chaînez LTX-2 avec des upscalers ou des nœuds post, guettez les décalages de dtype. La plupart des nœuds castent automatiquement, mais parfois vous payez une taxe mémoire cachée.

Ce qui a fonctionné pour moi

Sauvegardez deux versions du même graphe : l’une nommée _fp4 pour l’exploration, l’autre _fp8 pour les finales. De cette façon, je ne cherche pas un basculement.
Gardez l’aperçu activé sur les passes NVFP4. Si l’aperçu saccade, c’est généralement un signe que mon lot ou mon contexte est trop élevé même pour fp4.

Si vous voulez des détails, la documentation officielle ou le repo du nœud expliquent souvent comment le drapeau de précision est transmis. Je vérife ceux-ci quand quelque chose semble bizarre.

Testez les deux sur WaveSpeed

Je n’ai pas fait confiance à mes yeux seuls, donc je me suis appuyé sur une simple boucle : même invite, même graine, deux exécutions, l’une en NVFP4, l’autre en NVFP8, chronométrées avec un petit workflow WaveSpeed et un chronomètre à côté. Je me soucie moins des nombres exacts et plus de la forme de la différence.

Ce que j’ai mesuré (à peu près)

Débit : NVFP4 a régulièrement terminé 15–30 % plus rapidement sur ma boîte 16 Go : plus près de 20 % sur la boîte 24 Go.
Espace VRAM : NVFP4 m’a laissé 2–4 Go supplémentaires en 1080p, ce qui m’a permis de garder un nœud de débruitage léger actif. NVFP8 a mangé cette marge.
Visuels : sur un panoramique lent sur de la brique et du feuillage, NVFP8 a préservé la texture. NVFP4 a un peu flouté et ajouté un léger scintillement. Sur des clips riches en mouvement, j’ai à peine remarqué.

WaveSpeed (ou quel que soit le rig de benchmark que vous utilisez) m’aide à rester honnête. Je lance trois paires et j’élimine la première comme échauffement. Ensuite, je me pose une question ennuyeuse : ce paramètre m’a-t-il économisé des étapes ? Si la réponse est oui, ça colle.

Si vous voulez comparer NVFP4 et NVFP8 sans jongler avec les limites de VRAM locales, WaveSpeed vous permet d’exécuter les mêmes invites et graines LTX-2 sur des GPU cloud plus grands. C’est un moyen simple de vérifier la vitesse, l’espace VRAM et les compromis visuels avant de verrouiller les paramètres. Qui pourrait préférer quoi :

Si vous créez un storyboard, prototypez des fonctionnalités ou produisez des concepts en volume pour les réseaux sociaux d’abord, NVFP4 s’accorde bien avec les délais.
Si vous transmettez des cadres qui seront mis en pause, agrandis ou prêts pour l’impression, NVFP8 se justifie.

Je ne prétendrai pas que l’un est meilleur. Ce sont des vitesses différentes. Je bascule beaucoup moins maintenant que j’ai nommé quand chacun aide.

Une petite note que je garde dans un coin de mon carnet : quand un rendu semble « bruyant » à juger, ce n’est généralement pas un problème de précision, c’est un problème de prolifération des paramètres. J’élimine d’abord les variables, puis je bascule NVFP4/NVFP8.

C’est là où je vais le laisser. Hier, NVFP8 m’a économisé une heure que j’aurais passée à nettoyer les bords sur un visual 4K. Ce matin, NVFP4 m’a permis de prévisualiser quatre looks à la fois sans que le ventilateur semble décollant. Je n’ai pas besoin de plus que ça.