NVFP4 vs NVFP8 für LTX-2: Geschwindigkeit, Qualität & VRAM-Vergleich (RTX-Leitfaden)

Ich bin nicht gezielt auf Präzisionseinstellungen gestoßen. Ich bin auf sie getroffen, weil LTX-2 meine 16-GB-GPU während eines Batch-Renderings immer wieder an ihre Grenzen trieb. Die Vorschau fror ein, mein Lüfter heulte auf, und diese kleine Dropdown-Liste, NVFP4 oder NVFP8, fühlte sich plötzlich weniger wie eine Nischeoption an und mehr wie ein Weg, um den Tag zu überstehen.

In der letzten Woche (Januar 2026) habe ich LTX-2 mit NVFP4 und NVFP8 in einigen wenigen konstanten, langweiligen Szenarien getestet: kurze Clips in 1080p und 2K für Konzeptdurchläufe und ein paar 4K-Bilder und -Schwenks für Stimmungsbilder von Kunden. Nichts Spektakuläres, wissen Sie. Just die Art von Arbeiten, die sich ansammeln. Hier ist, was ich bemerkt habe, was funktioniert hat, und wo jede Einstellung ruhig geholfen hat oder im Weg stand.

NVFP4 vs. NVFP8 erklärt (eine kurze Zusammenfassung)

NVFP4 tauscht ein wenig Qualität und Stabilität gegen weniger VRAM und höheren Durchsatz: NVFP8 bewahrt Details besser, verlangt aber mehr von deiner GPU.

Geschwindigkeit / VRAM / Qualitäts-Tradeoff-Matrix

Ich halte das einfach, weil die Realität einfach ist.

Geschwindigkeit: NVFP4 war in meinen Tests normalerweise 15–30% schneller, je nach Auflösung und Batch-Größe: NVFP8 war etwas langsamer, aber stabil.
VRAM: NVFP4 reduzierte den Speicherbedarf um etwa 25–40% für mich: NVFP8 verbrauchte mehr, reduzierte aber Artefakte.
Qualität: NVFP8 behielt scharfe Kanten (Haare, Beschilderung, Mikro-Texturen) und reduzierte Shimmer in Bewegung: NVFP4 machte Details weicher und führte manchmal zu kleinen zeitlichen Wackeln ein.

Das ist die Form davon. Der Rest ist situationsabhängig.

Ein paar Feldnoten aus wiederholbaren Tests auf einer RTX 4090 (24 GB) und einer 4080 (16 GB):

1080p, kurze Clips (4–6s): NVFP4 hielt die Vorschau flüssig und ließ mich Batch-Größen erhöhen: NVFP8 hielt Gesichter und Schrift von Frame zu Frame sauberer.
2K, mittlere Clips (8–12s): NVFP4 war gut für erste Durchläufe: NVFP8 vermied das winzige “Krabbeln” auf Texturen beim Schwenken.
4K, Bilder: NVFP8 lohnte sich. Ich würde lieber ein bisschen warten, als Zeit mit Nachbearbeitung von Kanten verbringen.

Nichts davon war dramatisch. Aber ich spürte es. Weniger VRAM-Druck mit NVFP4 bedeutete weniger Unterbrechungen. Sauberere Ausgabe mit NVFP8 bedeutete weniger Neuanfänge.

Wann NVFP4 verwenden (Batch-Produktion / niedriges VRAM)

Ich griffe zu NVFP4, wenn mir der Ablauf wichtiger ist als das Finish.

Wo NVFP4 geholfen hat

Batch-Konzeptdurchläufe: Ich konnte 3–6 Prompts parallel in 1080p auf 16 GB ausführen, ohne den Speicher zu jonglieren. Das bedeutete, ich blieb im Ablauf und verglich Optionen schneller.
Grobe Schnitte und Animatics: Für schnelle Boards mit Platzhalter-Aufnahmen spielte die leichte Weichheit keine Rolle. Sie versteckte sogar Eigenheiten.
Lange Sitzungen: VRAM-Spielraum bedeutete weniger Neustarts. Weniger Reibung addiert sich über einen Tag hinweg.

Tradeoffs, die ich wirklich bemerkt habe

Mikro-Detail-Verlust: Feine Muster (Netz, Haarlinien-Typ, kleine Reflexionen) wurden leicht abgeschwächt. Nicht kaputt, nur weniger knackig.
Zeitliche Stabilität: Bei langsamen Schwenks führte NVFP4 manchmal zu einem winzigen Flimmern in hochfrequenten Bereichen. Es war nicht immer offensichtlich in der Timeline, aber es zeigte sich beim Pausieren.

Praktische Bereiche, die sich für mich sicher anfühlten

1080p, kurze Clips: NVFP4 mit bescheidenen Batch-Größen (2–4) lag gut unter 16 GB.
2K, kurze Clips: NVFP4 hielt die Dinge auf 16 GB flüssig, wenn ich die Kontextlänge nicht zu hoch trieb.

Warum es verwenden: NVFP4 ist eine gute “Denk-Präzision”. Es senkt die Kosten der Ideenerkundung. Wenn die Ausgabe nur für dich oder eine Team-Überprüfung gedacht ist, macht NVFP4 LTX-2 leicht anfühlen.

Wann NVFP8 verwenden (Qualität / feine Details)

Ich wechsle zu NVFP8, wenn ich die Schleife schließe.

Wo NVFP8 sich lohnte

Finale Frames für Decks: Wenn ein Frame herumgereicht, mit Kunden geteilt, im Portfolio oder Social Media sein könnte, reduzierte NVFP8 die Nachbearbeitung.
Gesichter und Hände: Kanten hielten besser, und die kleine Unruhe um Wimpern/Haarlinien beruhigte sich.
Schrift und Beschilderung: Nicht perfekt, aber öfter lesbar. Weniger Re-Renders nur um einen zittrigen Buchstaben zu korrigieren.

Kosten, die man akzeptieren muss

Schwereres VRAM: Bei 16 GB hielt ich die Batch-Größen bei 2K niedrig und vermied zusätzliche Knoten in demselben Graphen zu stapeln.
Ein bisschen langsamer: Ich machte mir nichts aus der Wartezeit, weil ich NVFP8 nur lief, wenn mir der Shot gefiel.

Wenn du sogar für Bilder 4K anfässt, ist NVFP8 die sicherere Standardeinstellung. Ich versuchte einmal, Zeit mit NVFP4 in 4K zu sparen: Ich verbrachte diese Zeit in der Nachbearbeitung mit Kantenbereinigung.

Config-Tabelle nach Auflösung (1080p / 2K / 4K)

Das sind keine Regeln. Sie sind das, was mich ohne ständiges Herumbasteln in Bewegung hielt. Hardware zählt. Das war auf:

RTX 4080 16 GB (Desktop)
RTX 4090 24 GB (Studio-Maschine)

Definitionen:

“Batch” hier = parallele Prompts oder Clips innerhalb eines Graph-Durchlaufs.
“Kontext/Länge” = wie lange deine Sequenz läuft oder wie viel Konditionierung du packst.

1080p (1920×1080)

16 GB: NVFP4, Batch 3–4, kurze Clips (≤6s) fühlen sich sicher an: NVFP8, Batch 2, stabil.
24 GB: NVFP4, Batch 6–8 einfach: NVFP8, Batch 3–4 mit Platz für Extras.

2K (2048×1152 oder 2048×1536)

16 GB: NVFP4, Batch 2–3: NVFP8, Batch 1–2: halte Kontext moderat.
24 GB: NVFP4, Batch 4: NVFP8, Batch 2–3, beobachte Knoten-Stapelung.

4K (3840×2160)

16 GB: NVFP4, nur Singles, kurze Kontexte: NVFP8, Singles, sei geduldig.
24 GB: NVFP4, Batch 2 in einem mageren Graph: NVFP8, Single oder Batch 2, wenn andere Knoten leicht sind.

Zeichen, dass du es zu weit treibst:

VRAM-Spitzen beim Scrubben oder Seed-Änderungen mitten im Lauf.
Die Ausgabe startet gut, aber verschlechtert sich in späteren Frames.
ComfyUI-Vorschau pausiert länger zwischen Frames als üblich.

Wenn du eines davon triffst, senke zuerst die Batch-Größe. Dann verkürze die Sequenz. Präzision ist normalerweise der letzte Hebel, den ich ziehe.

Wie man Präzision in ComfyUI wechselt

Das hängt ein bisschen vom Node-Pack ab, das du verwendest, aber hier ist, was ich gesehen habe (Januar 2026):

Model Loader oder LTX-2 Node: Es gibt normalerweise ein Precision oder Dtype Dropdown. Ich habe Optionen wie NVFP4, NVFP8 und float16 gesehen. Ich wechsle dort und halte den Rest des Graphen unverändert.
Wenn es kein Dropdown gibt: Überprüfe die Dokumentation des Nodes oder die Repo-Readme. Einige Builds erben die Einstellung von einer globalen Konfiguration oder einem Environment-Flag.
Gemischte Graphen: Wenn du LTX-2 mit Upscalern oder Post-Nodes verkettst, achte auf Dtype-Konflikte. Die meisten Nodes casten automatisch, aber manchmal zahlst du eine versteckte Speichergebühr.

Was für mich funktionierte

Speichere zwei Versionen desselben Graphen: eine mit dem Namen _fp4 zur Erkundung, eine _fp8 für Finals. So muss ich nicht nach einem Schalter suchen.
Halte die Vorschau bei NVFP4-Durchläufen aktiviert. Wenn die Vorschau stottert, ist das normalerweise ein Zeichen, dass mein Batch oder Kontext auch für fp4 zu hoch ist.

Wenn du Spezifisches möchtest, erklären die offiziellen Dokumente oder das Node-Repo oft, wie das Präzisions-Flag übergeben wird. Ich überprüfe diese, wenn etwas sich falsch anfühlt.

Teste beide auf WaveSpeed

Ich vertraute meinen Augen nicht allein, also lehnte ich mich auf eine einfache Schleife: gleicher Prompt, gleicher Seed, zwei Durchläufe, einer in NVFP4, einer in NVFP8, gemessen mit einem kleinen WaveSpeed-Workflow und einer Stoppuhr an der Seite. Mir ist die genaue Zahl weniger wichtig als die Form des Unterschieds.

Was ich gemessen habe (ungefähr)

Durchsatz: NVFP4 war auf meiner 16-GB-Box durchgehend 15–30% schneller: näher an 20% auf der 24-GB-Box.
VRAM-Spielraum: NVFP4 ließ mir 2–4 GB Extra bei 1080p, was mir ermöglichte, einen leichten Denoise-Node aktiv zu halten. NVFP8 aß diesen Spielraum auf.
Visuals: Bei einem langsamen Schwenk über Ziegel und Laub behielt NVFP8 die Textur. NVFP4 machte es ein bisschen unschärfer und fügte ein winziges Shimmer hinzu. Bei bewegungsreichen Clips bemerkte ich kaum einen Unterschied.

WaveSpeed (oder welches Benchmark-Rig du auch verwendest) hilft mir, ehrlich zu bleiben. Ich führe drei Paare aus und werfe das erste als Aufwärmphase weg. Dann stelle ich eine langweilige Frage: Hat diese Einstellung mir Schritte gespart? Wenn die Antwort ja ist, bleibt sie erhalten.

Wenn du NVFP4 und NVFP8 vergleichen möchtest ohne dich mit lokalen VRAM-Grenzen herumzuschlagen, lässt dich WaveSpeed die gleichen LTX-2-Prompts und Seeds auf größeren Cloud-GPUs ausführen. Es ist ein unkomplizierter Weg, um Geschwindigkeit, Speicher-Spielraum und visuelle Tradeoffs zu überprüfen, bevor du Einstellungen verriegelst. Wer könnte welche bevorzugen:

Wenn du Storyboards entwirfst, Features prototypierst oder Social-First-Konzepte in großer Menge produzierst, passt NVFP4 gut zu Deadlines.
Wenn du Frames übergibst, die angehalten, vergrößert oder druckbereit sein werden, verdient NVFP8 seinen Platz.

Ich werde nicht behaupten, dass einer besser ist. Sie sind unterschiedliche Gänge. Ich wechsle viel weniger jetzt, wo ich benannt habe, wann jeder hilft.

Eine kleine Notiz, die ich in der Ecke meines Notizbuches halte: Wenn ein Render sich zu urteilen “verrauscht” anfühlt, ist es normalerweise kein Präzisionsproblem, es ist ein Settings-Überfluss-Problem. Ich schneide zuerst Variablen ab, dann schalte ich NVFP4/NVFP8 um.

Da werde ich es belassen. Gestern hat NVFP8 mir eine Stunde gespart, die ich mit der Bereinigung von Kanten bei einem 4K-Bild verbracht hätte. Heute Morgen ließ mich NVFP4 vier Looks auf einmal in der Vorschau ansehen, ohne dass der Lüfter wie beim Start klang. Ich brauche nicht mehr als das.