NVFP4 vs NVFP8 untuk LTX-2: Perbandingan Kecepatan, Kualitas & VRAM (Panduan RTX)

Saya tidak mencari pengaturan presisi. Saya menemukanya karena LTX-2 terus-menerus mendorong GPU 16 GB saya ke batas selama render batch. Pratinjau membeku, kipas saya berteriak, dan dropdown kecil itu, NVFP4 atau NVFP8, tiba-tiba terasa kurang seperti opsi niche dan lebih seperti cara untuk bertahan sehari.

Selama seminggu terakhir (Jan 2026), saya menguji LTX-2 dengan NVFP4 dan NVFP8 di beberapa skenario yang stabil dan membosankan: klip pendek pada 1080p dan 2K untuk lintasan konsep, dan beberapa stills 4K serta pan untuk mood board klien. Tidak ada yang heroik tahu. Hanya jenis pekerjaan yang menumpuk. Inilah apa yang saya perhatikan, apa yang berhasil, dan di mana setiap pengaturan secara diam-diam membantu, atau menghalangi.

NVFP4 vs NVFP8 Dijelaskan (ringkasan satu kalimat)

NVFP4 menukar sedikit kualitas dan stabilitas untuk VRAM lebih rendah dan throughput lebih cepat: NVFP8 mempertahankan detail dengan lebih baik tetapi meminta lebih banyak dari GPU Anda.

Matriks Trade-off Kecepatan / VRAM / Kualitas

Saya akan menyederhanakannya karena realitasnya sederhana.

Kecepatan: NVFP4 biasanya 15–30% lebih cepat dalam percobaan saya, tergantung resolusi dan ukuran batch: NVFP8 sedikit melambat tetapi tetap konsisten.
VRAM: NVFP4 mengurangi jejak memori sekitar 25–40% untuk saya: NVFP8 menggunakan lebih banyak tetapi mengurangi artefak.
Kualitas: NVFP8 mempertahankan tepi halus (rambut, signage, mikro-tekstur) dan mengurangi shimmer dalam gerak: NVFP4 melembutkan detail dan terkadang menambah wobble temporal kecil.

Itulah bentuknya. Sisanya situasional.

Beberapa catatan lapangan dari tes yang dapat diulang pada RTX 4090 (24 GB) dan 4080 (16 GB):

1080p, klip pendek (4–6s): NVFP4 membuat pratinjau tetap lancar dan memungkinkan saya meningkatkan ukuran batch: NVFP8 membuat wajah dan tipe lebih bersih frame-to-frame.
2K, klip sedang (8–12s): NVFP4 cocok untuk lintasan pertama: NVFP8 menghindari “crawl” kecil pada tekstur saat panning.
4K, stills: NVFP8 sepadan. Saya lebih suka menunggu daripada menghabiskan waktu untuk retouching tepi.

Tidak ada dari ini yang dramatis. Tetapi saya merasakannya. Tekanan VRAM lebih rendah dengan NVFP4 berarti lebih sedikit gangguan. Output lebih bersih dengan NVFP8 berarti lebih sedikit pengulangan.

Kapan Menggunakan NVFP4 (produksi batch / VRAM rendah)

Saya menggunakan NVFP4 ketika saya peduli lebih tentang alur daripada finishing.

Di mana NVFP4 membantu

Batch lintasan konsep: Saya bisa menjalankan 3–6 prompt secara paralel pada 1080p pada 16 GB tanpa berjongkok-jongkok memori. Itu berarti saya tetap dalam alur dan membandingkan opsi lebih cepat.
Rough cuts dan animatics: Untuk papan cepat dengan shot placeholder, kelembutan kecil tidak penting. Sebenarnya itu menyembunyikan keanehan.
Sesi panjang: Headroom VRAM berarti restart lebih sedikit. Kurang gesekan bertambah selama sehari.

Trade-off yang benar-benar saya perhatikan

Kehilangan detail mikro: Pola halus (mesh, jenis hairline, refleksi kecil) sedikit diredam. Tidak rusak, hanya kurang tajam.
Stabilitas temporal: Pada pan lambat, NVFP4 terkadang memperkenalkan flicker kecil di area frekuensi tinggi. Tidak selalu jelas di timeline, tetapi muncul saat dijeda.

Rentang praktis yang terasa aman untuk saya

1080p, klip pendek: NVFP4 dengan ukuran batch sedang (2–4) duduk jauh di bawah 16 GB.
2K, klip pendek: NVFP4 menjaga segalanya tetap lancar pada 16 GB jika saya tidak mendorong panjang konteks terlalu tinggi.

Mengapa menggunakannya: NVFP4 adalah “presisi pemikiran” yang baik. Ini mengurangi biaya menjelajahi ide. Jika output hanya untuk Anda atau pemeriksaan tim, NVFP4 membuat LTX-2 terasa ringan.

Kapan Menggunakan NVFP8 (kualitas / detail halus)

Saya beralih ke NVFP8 ketika saya menutup loop.

Di mana NVFP8 sepadan

Frame akhir untuk deck: Jika frame mungkin bepergian, berbagi klien, portofolio, atau media sosial, NVFP8 mengurangi pembersihan.
Wajah dan tangan: Tepi bertahan lebih baik, dan kesigsaan kecil di sekitar bulu mata/garis rambut menetap.
Tipe dan signage: Tidak sempurna, tetapi lebih sering dapat dibaca. Render ulang lebih sedikit hanya untuk memperbaiki huruf yang bergetar.

Biaya untuk diterima

VRAM lebih berat: Pada 16 GB, saya menjaga ukuran batch tetap rendah pada 2K dan menghindari tumpukan node ekstra dalam grafik yang sama.
Lebih lambat sedikit: Saya tidak keberatan menunggu karena saya menjalankan NVFP8 hanya setelah saya menyukai shot.

Jika Anda menyentuh 4K bahkan untuk stills, NVFP8 adalah default yang lebih aman. Saya mencoba menghemat waktu dengan NVFP4 sekali pada 4K: saya menghabiskan waktu itu kembali di post membersihkan tepi.

Tabel Konfigurasi menurut Resolusi (1080p / 2K / 4K)

Ini bukan aturan. Mereka adalah apa yang membuat saya bergerak tanpa fidgeting konstan. Hardware penting. Ini adalah:

RTX 4080 16 GB (desktop)
RTX 4090 24 GB (studio machine)

Definisi:

“Batch” di sini = prompt atau klip paralel dalam satu run grafik.
“Konteks/panjang” = seberapa lama urutan Anda berjalan atau berapa banyak conditioning yang Anda kemasan.

1080p (1920×1080)

16 GB: NVFP4, batch 3–4, klip pendek (≤6s) terasa aman: NVFP8, batch 2, stabil.
24 GB: NVFP4, batch 6–8 mudah: NVFP8, batch 3–4 dengan ruang untuk extras.

2K (2048×1152 atau 2048×1536)

16 GB: NVFP4, batch 2–3: NVFP8, batch 1–2: jaga konteks sedang.
24 GB: NVFP4, batch 4: NVFP8, batch 2–3, perhatikan tumpukan node.

4K (3840×2160)

16 GB: NVFP4, hanya singles, konteks pendek: NVFP8, singles, bersabarlah.
24 GB: NVFP4, batch 2 dalam grafik lean: NVFP8, single atau batch 2 jika node lain ringan.

Tanda-tanda Anda mendorongnya:

Lonjakan VRAM saat scrubbing atau mengubah seed mid-run.
Output dimulai dengan baik tetapi menurun di frame berikutnya.
Pratinjau ComfyUI berhenti lebih lama antara frame daripada biasanya.

Jika Anda mengalami salah satu dari itu, turunkan ukuran batch terlebih dahulu. Kemudian perpendek urutan. Presisi biasanya lever terakhir yang saya tarik.

Cara Mengubah Presisi di ComfyUI

Ini tergantung sedikit pada paket node yang Anda gunakan, tetapi inilah apa yang saya lihat (Jan 2026):

Model loader atau node LTX-2: biasanya ada dropdown Precision atau Dtype. Saya telah melihat opsi seperti NVFP4, NVFP8, dan float16. Saya menggantinya di sana dan membiarkan grafik lainnya tidak berubah.
Jika tidak ada dropdown: periksa docs node atau readme repo. Beberapa build mewarisi pengaturan dari konfigurasi global atau flag lingkungan.
Grafik campuran: jika Anda menggabungkan LTX-2 dengan upscaler atau node post, perhatikan ketidakcocokan dtype. Sebagian besar node cast secara otomatis, tetapi terkadang Anda membayar pajak memori tersembunyi.

Apa yang berhasil untuk saya

Simpan dua versi grafik yang sama: satu bernama _fp4 untuk eksplorasi, satu _fp8 untuk finals. Dengan cara itu saya tidak mencari toggle.
Jaaga pratinjau diaktifkan pada pass NVFP4. Jika pratinjau tersentak, biasanya tanda bahwa batch atau konteks saya terlalu tinggi bahkan untuk fp4.

Jika Anda menginginkan specifics, docs resmi atau repo node sering kali menjelaskan bagaimana flag presisi dilewatkan. Saya cross-check mereka ketika sesuatu terasa off.

Uji Keduanya di WaveSpeed

Saya tidak percaya pada mata saya saja, jadi saya bergantung pada loop sederhana: prompt yang sama, seed yang sama, dua run, satu dalam NVFP4, satu di NVFP8, diwaktu dengan workflow WaveSpeed kecil dan stopwatch di samping. Saya peduli lebih sedikit tentang angka yang tepat dan lebih tentang bentuk perbedaannya.

Apa yang saya ukur (kira-kira)

Throughput: NVFP4 secara konsisten selesai 15–30% lebih cepat di kotak 16 GB saya: lebih dekat ke 20% pada kotak 24 GB.
Headroom VRAM: NVFP4 meninggalkan saya 2–4 GB ekstra pada 1080p, yang memungkinkan saya menjaga node denoise ringan tetap aktif. NVFP8 memakan margin itu.
Visuals: pada pan lambat di seluruh batu bata dan dedaunan, NVFP8 mempertahankan tekstur. NVFP4 sedikit blur dan menambah shimmer kecil. Pada klip yang kaya gerak, saya hampir tidak memperhatikannya.

WaveSpeed (atau rig benchmark apapun yang Anda gunakan) membantu saya tetap jujur. Saya menjalankan tiga pasang dan membuang yang pertama sebagai warm-up. Kemudian saya mengajukan pertanyaan yang membosankan: apakah pengaturan ini menghemat saya langkah-langkah? Jika jawabannya ya, itu melekat.

Jika Anda ingin membandingkan NVFP4 dan NVFP8 tanpa berjongkok-jongkok batas VRAM lokal, WaveSpeed memungkinkan Anda menjalankan prompt dan seed LTX-2 yang sama pada GPU cloud yang lebih besar. Ini adalah cara langsung untuk sanity-check kecepatan, headroom memori, dan trade-off visual sebelum Anda mengunci pengaturan. Siapa yang mungkin lebih suka yang mana:

Jika Anda membuat storyboard, membuat prototype fitur, atau menghasilkan konsep social-first dalam volume, NVFP4 berpasangan baik dengan deadline.
Jika Anda menyerahkan frame yang akan dijeda, diperbesar, atau siap cetak, NVFP8 menghasilkan nilainya.

Saya tidak akan mengklaim yang satu lebih baik. Mereka adalah gigi yang berbeda. Saya beralih jauh lebih sedikit sekarang bahwa saya telah menamai kapan masing-masing membantu.

Catatan kecil yang saya simpan di sudut notebook saya: ketika render terasa “bising” untuk dinilai, biasanya bukan masalah presisi, itu adalah masalah penyebaran pengaturan. Saya memotong variabel terlebih dahulu, kemudian toggle NVFP4/NVFP8.

Itulah tempat saya akan meninggalkannya. Kemarin, NVFP8 menghemat saya satu jam yang akan saya habiskan membersihkan tepi pada stills 4K. Pagi ini, NVFP4 memungkinkan saya melihat pratinjau empat penampilan sekaligus tanpa kipas yang terdengar seperti takeoff. Saya tidak perlu lebih dari itu.