Perbaiki Kesalahan LTX-2 di ComfyUI: Solusi OOM, Frame Hitam & Flicker

Perbaiki Kesalahan LTX-2 di ComfyUI: Solusi OOM, Frame Hitam & Flicker

Hei, ini Dora. Saya tidak bermaksud untuk men-debug LTX-2 di ComfyUI. Semuanya dimulai dengan jeda kecil: jendela pratinjau hitam setelah alur kerja yang telah saya jalankan puluhan kali. Tidak ada kegagalan dramatis. Hanya… tidak ada apa-apa. Saya coba lagi, memantau konsol, menyesuaikan pengaturan atau dua. Pada akhir minggu (diuji 6–10 Januari 2026), saya telah mengumpulkan beberapa perbaikan yang terus berulang. Ini bukan tutorial besar, lebih seperti catatan yang saya serahkan ke teman yang juga mencoba membuat LTX-2 berperilaku baik tanpa mengubah pagi mereka menjadi penginstalan ulang driver. Tahu, jenis kekacauan diam yang kita semua kenal terlalu baik.

Diagnosis 60 Detik (pemetaan gejala → penyebab)

Ketika LTX-2 berperilaku buruk di ComfyUI, saya telah menemukan pencocokan pola cepat mengalahkan tebakan. Berikut adalah peta 60 detik yang saya jalankan sebelum menyentuh apa pun yang berat:

Gejala: Kedipan atau pergeseran bingkai ke bingkai
Penyebab yang mungkin: panduan tidak stabil (CFG terlalu tinggi), mengubah benih, pengaturan gerak terlalu kuat.
Coba cepat: perbaiki bijinya, turunkan CFG sedikit, geser gerak/denoise ke bawah, tambahkan langkah konsistensi temporal.

Gejala: Pergeseran warna aneh, “salju,” atau blok yang teregang
Penyebab yang mungkin: ketidakcocokan berat/versi, VAE salah, cache yang rusak atau unduhan sebagian.
Coba cepat: verifikasi ulang hash, hapus cache model, konfirmasi kompatibilitas VAE.

Gejala: Kesalahan node tentang bentuk atau NoneType
Penyebab yang mungkin: node tidak mengeluarkan output (kegagalan sebelumnya), atau versi node/model yang tidak kompatibel.
Coba cepat: isolasi cabang yang gagal, jalankan hingga node itu saja, periksa konsol ComfyUI untuk baris kesalahan nyata pertama. Jika salah satu ini terjadi, saya berhenti. Satu perubahan pada satu waktu. Kemudian saya menjalankan ulang klip 2–3 detik sehingga saya tidak membuang waktu pada render panjang.

Perbaikan OOM: Urutan Downgrade Resolusi / Presisi / Batch

Rutin OOM saya membosankan, tetapi berhasil. Saya melakukannya dengan urutan ini dan saya hanya beralih ke langkah berikutnya jika OOM terus berlanjut:

1. Resolusi pertama

  • Turunkan tinggi/lebar sebesar 20–30% bukannya membagi dua. Banyak grafik LTX-2 sensitif terhadap stride (kelipatan 8 atau 16). Saya menjaga dimensi dapat dibagi 16 untuk menghindari padding tersembunyi.
  • Jika Anda menargetkan 1024×576, coba 896×504. Biarkan saya memberitahu Anda, terlihat lebih dekat dengan aslinya daripada yang Anda harapkan.

2. Presisi selanjutnya

  • Beralih presisi model ke fp16 (atau bf16 jika tumpukan Anda mendukungnya) di node pemuat yang relevan. Pada GPU konsumen NVIDIA, fp16 biasanya memberikan penghematan memori paling bersih.
  • Presisi campuran oke, tetapi saya menghindari toggle per-node di tengah-run. Berkomitmen pada satu presisi untuk bagian berat.

3. Ukuran batch terakhir

  • Atur batch ke 1 untuk pengambilan sampel video. Bahkan batch kecil mengalikan aktivasi kunci dalam memori. Saya hanya menaikkan batch untuk latent cepat atau pratinjau.

Saya juga memperhatikan keuntungan halus: kunci benih sambil menyesuaikan OOM. Keacakan dapat menyamarkan apakah perubahan terakhir Anda benar-benar membantu.

Layar Hitam: Masalah Pemuatan Model vs Decode

Layar hitam pertama saya minggu ini ternyata bukan kegagalan model sama sekali. Ini adalah kejanggalan decode.

Bagaimana saya memisahkan keduanya dengan cepat

Periksa ukuran file dan durasi

  • Jika video memiliki panjang yang tepat dan ukuran yang kira-kira diharapkan, frame mungkin ada di sana. Pemutar Anda mungkin tidak menyukai format piksel atau ruang warna.

  • Kode ulang dengan baseline aman:
    ffmpeg -i input.mp4 -pix_fmt yuv420p -c:v libx264 -crf 18 output.mp4
    (lihat dokumentasi FFmpeg untuk opsi pengodean lebih lanjut) Scrub konsol ComfyUI

  • Masalah pemuatan model yang benar mengumumkan diri mereka: bobot yang hilang, kunci yang tidak kompatibel, atau ketidakcocokan hash VAE/model.

  • Jika Anda melihat log pengambilan sampel yang berhasil dan tidak ada pengecualian, mungkin itu jalur tampilan/encode.

Ketidakcocokan dimensi laten

  • Pipeline LTX-2 mengharapkan stride tertentu (sering kali kelipatan 16). Jika input laten atau kontrol Anda tidak cocok, Anda bisa mendapatkan frame kosong atau hampir hitam.
  • Saya memverifikasi bahwa simpul resize apa pun terjadi sebelum model mengharapkannya, dan semua cabang setuju tentang lebar/tinggi.

Kejutan jangkauan warna

  • Rentang penuh vs terbatas dapat terlihat hancur menjadi hitam di beberapa pemain. Kode ulang cepat (di atas) biasanya menyelesaikannya.

Jika itu adalah masalah pemuatan model, saya pergi ke sumbernya: periksa bahwa jalur checkpoint LTX-2 di node pemuat menunjuk ke file aktual, konfirmkan checksum, dan pastikan format berat yang diharapkan node (safetensors vs ckpt) cocok dengan file. Dokumentasi ComfyUI resmi dan README model adalah satu-satunya halaman yang saya percayai untuk catatan versi/format.

Perbaikan Flicker: Parameter Stabilitas & Prompt Anchoring

Flicker tidak selalu bug. Kadang-kadang model melakukan persis apa yang diperintahkan, dengan terlalu banyak kebebasan.

Apa yang menenangkan hal-hal bagi saya:

  • Perbaiki bijinya
    Saya mengunci benih untuk tes A/B apa pun. Ini menghilangkan satu variabel licin langsung.

  • Turunkan CFG sedikit
    Jika saya berada di 8–9, saya coba 6. Panduan terlalu tinggi dapat menarik bingkai ke arah yang berbeda.

  • Kekuatan denoise dan gerak
    Pengurangan lembut di sini (10–20%) sering membantu lebih dari menaikkan langkah. Saya telah menemukan bahwa denoise sedikit lebih rendah menjaga sinyal temporal dengan lebih baik.

  • Prompt anchoring
    Pertahankan prompt dasar yang stabil dan pindahkan perubahan ke bagian kecil yang jelas (keyframe atau singkat dalam tanda kurung). Mengubah seluruh kalimat di seluruh bingkai mengundang drift.

  • Lintasan konsistensi temporal
    Jika grafik Anda memiliki simpul temporal/konsistensi, jalankan secara ringan. Itu tidak akan menciptakan detail, tetapi dapat mengamplas jitter.

  • Pilihan sampler
    Saya menguji 2–3 sampler dengan benih yang sama. Beberapa lebih melompat pada video. Jika satu menenangkan tepinya pada hitungan langkah yang sama, saya menyimpannya.

Catatan kecil: Saya berhenti mengejar “sempurna” koherensi bingkai. Tujuan bagi saya adalah kelelahan mental yang lebih rendah sambil mengedit, sesuatu yang bisa saya potong, bukan kesempurnaan di bawah mikroskop.

Output Rusak: Ketidakcocokan Berat / Kesalahan Jalur

Korosi muncul bagi saya sebagai blok merah muda, salju yang bersinar, atau banding warna yang tidak sesuai dengan prompt. Setiap kali, itu adalah sesuatu yang biasa saja:

  • Bobot yang tidak cocok
    Pemuat mengharapkan varian LTX-2 tertentu: saya memiliki yang berbeda dengan penamaan serupa. Saya sekarang menyertakan tanggal model atau hash dalam nama file.

  • VAE yang salah
    Menukar VAE secara sembarangan menggigit saya. Perbaikannya sederhana: gunakan VAE yang ditentukan oleh dokumentasi node LTX-2 atau README model. Jika tidak ada yang ditentukan, default ke yang disertakan atau direkomendasikan oleh penulis grafik.

  • Unduhan sebagian
    Checkpoint 3–8 GB yang gagal pada 95% terlihat lengkap di tampilan folder. Saya memeriksa ukuran file terhadap daftar repo dan, jika tersedia, memverifikasi hash.

  • Kesalahan jalur (Windows khususnya)
    Karakter non-ASCII dan jalur yang sangat panjang telah memecahkan beban bagi saya di masa lalu. Percayalah, saya membuat jalur model pendek (misalnya, D:\models\ltx2\…) dan menghindari spasi jika bisa.

  • Format campuran
    safetensors vs .ckpt tidak dapat dipertukarkan di beberapa simpul. Saya mencocokkan ekspektasi simpul.

Ketika saya mencurigai korosi, saya menjalankan ulang prompt kecil yang dikenal baik di resolusi kecil. Jika itu bersih, saya tahu masalahnya hidup dalam kombo saat ini, bukan seluruh instalasi.

Pembacaan Log: Lapisan Mana yang Jatuh

Sebagian besar penghematan waktu saya datang dari membaca baris yang gagal pertama, bukan yang dramatis terakhir. Konsol ComfyUI biasanya memberi tahu Anda cukup jika Anda memperlambat diri selama tiga puluh detik.

Yang saya cari:

  • CUDA kehabisan memori
    Bukan bug. Kurangi res/presisi/batch seperti di atas. Jika gagal pada langkah yang sama setiap kali, Anda memukul puncak aktivasi tertentu, turunkan langkah atau aktifkan perhatian hemat memori.

  • CUDNN_STATUS_EXECUTION_FAILED atau akses memori ilegal
    Sering kali driver atau ketidakcocokan perpustakaan. Saya mencatat versi CUDA, PyTorch, dan GPU saya dalam file teks. Jika saya baru saja memperbarui satu, saya mengembalikannya atau membangun kembali venv. Dokumentasi ComfyUI memiliki matriks kecil kombo yang dikenal baik.

  • Ukuran ketidakcocokan / kesalahan bentuk
    Tensor adalah bentuk yang salah. Ini biasanya masalah grafik simpul: resize terjadi pada satu cabang dan bukan yang lain, atau input kontrol mengharapkan skala yang berbeda. Saya melacak dimensi di mana mereka menyimpang.

  • KeyError / kunci state_dict yang hilang
    Ketidakcocokan berat–simpul. Bandingkan kunci yang hilang yang terdaftar dengan README model. Varian checkpoint yang salah atau simpul yang ketinggalan zaman.

  • AttributeError: ‘NoneType’ …
    Simpul sebelumnya mengembalikan tidak ada. Saya menjalankan grafik hingga simpul itu saja. None pertama adalah budak nyata.

Dua kebiasaan yang membantu:

  • Jalankan klip pendek saat debug. Sepuluh detik log kegagalan membuang jauh lebih sedikit waktu daripada satu menit keheningan.
  • Aktifkan toggle debug/verbose apa pun yang tersedia di simpul yang mencurigakan. Konteks ekstra mengalahkan tebakan.

Saya menyimpan “kartu lingkungan” kecil di folder proyek: model GPU dan VRAM, driver, CUDA, PyTorch, komit ComfyUI, versi paket simpul, dan hash checkpoint LTX-2. Ketika ada yang rusak, saya membandingkannya dengan kartu minggu lalu sebelum saya menyalahkan model.

Kapan Beralih ke Cloud (pintas pemecahan masalah WaveSpeed)

Saya tidak terburu-buru ke cloud untuk LTX-2, tetapi ada momen ketika itu cara paling bersih untuk memisahkan “suasana hati mesin saya” dari masalah aktual.

Kapan saya beralih

  • VRAM di bawah 16 GB dan saya membutuhkan output 1024p tanpa kompromi berat.
  • Saya melihat crash yang cacat yang terikat pada versi CUDA/driver lokal saya, dan saya tidak punya waktu untuk membangun kembali.
  • Saya ingin pendapat kedua: grafik yang sama, perangkat keras yang berbeda.

Apa yang saya lakukan di WaveSpeed (atau ruang kerja GPU yang sebanding)

  • Pilih gambar yang dikenal baik (kombo CUDA/PyTorch yang didokumentasikan). Itu penting lebih dari TFLOPS mentah ketika Anda men-debug.
  • Sinkronkan hanya grafik minimal, bobot LTX-2 yang tepat (dengan hash), dan satu prompt pengujian pendek.
  • Jalankan kasus yang dapat direproduksi terkecil terlebih dahulu. Jika berhasil di cloud dan bukan secara lokal, mungkin lingkungan: jika gagal di keduanya, itu grafik atau bobot.

Biaya dan pertukaran

  • Ya, Anda akan membayar untuk komputasi. Tetapi satu repro bersih dapat menghemat sore driver roulette.
  • Disk cloud dapat menyembunyikan masalah jalur juga, hanya dengan cara yang berbeda. Saya masih menjaga jalur pendek dan ASCII.

Ini bukan dorongan untuk memindahkan alur kerja Anda. Itu hanya pintas diam ketika Anda terjebak men-debug dan tenggat waktu lebih keras daripada kesabaran Anda.

Kami membangun WaveSpeed untuk momen persis seperti ini — ketika Anda hanya membutuhkan lingkungan GPU bersih untuk mengesampingkan hal-hal dengan cepat. Jika Anda terjebak men-debug LTX-2, Anda dapat mencoba WaveSpeed kami di sini.


Bug LTX-2 tergila yang pernah Anda jalankan minggu ini? Tinggalkan komentar dan biarkan saya tahu jika itu jebakan baru.