Pasang LTX-2 di ComfyUI di Windows: Panduan Setup CUDA & Jalankan Pertama Kali

Halo, saya Dora. Hari itu, saya hanya ingin mencoba text-to-video cepat untuk sketsa, dan saya terus melihat LTX-2 disebut-sebut di forum ComfyUI. Menjelang tengah pagi saya sudah menatap graf kosong dan folder bernama “ltx,” bertanya-tanya apakah saya baru saja mendaftar untuk permainan driver lagi.

Saya membuat catatan saat mengatur di Windows 11. Jika Anda mencari “ltx-2 comfyui windows” karena Anda sedang di tengah instalasi, saya tahu rasanya. Inilah yang membantu.

Daftar Periksa Pra-Instalasi (GPU / CUDA / versi driver)

Pemeriksaan cepat sebelum Anda mulai menghemat waktu yang akan Anda habiskan untuk mengejar kesalahan DLL nanti:

GPU: Kartu NVIDIA dengan setidaknya 12 GB VRAM membuat LTX-2 dapat digunakan untuk saya dengan pengaturan sederhana (lebar 512–768, klip pendek). 8 GB dapat bekerja dengan pengaturan sangat konservatif, tetapi itu ketat dan sering membuat frustrasi.
Driver: Perbarui ke driver Game Ready atau Studio terbaru (saya menggunakan 552.xx).
CUDA: Anda tidak menginstal toolkit CUDA lengkap untuk portable ComfyUI. Anda hanya memerlukan DLL runtime yang disertakan dengan PyTorch. Inilah mengapa mencocokkan build PyTorch+CUDA penting (cu121 atau cu122, dll.).
Python: Build portable ComfyUI disertakan dengan Python sendiri. Jika Anda menjalankan venv khusus, pastikan selaras dengan roda PyTorch yang Anda pilih.
VC++ Redistributable: Pasang/perbaiki Microsoft Visual C++ Redistributable terbaru. Ini adalah perbaikan diam untuk kesalahan DLL gaya “procedure entry point”.

Dua pemeriksaan akal sehat yang saya lakukan sebelum model berat apa pun:

nvidia-smi berjalan di terminal dan menunjukkan driver dengan bersih.
python -c "import torch: print(torch.version, torch.cuda.is_available())" mengembalikan True untuk CUDA di mana pun lingkungan ComfyUI akan digunakan.

Tidak ada yang menjamin pelayaran mulus, tetapi itu mempersempit mode kegagalan.

Perbarui ComfyUI ke Versi Siap LTX-2

Yang saya lakukan:

Perbarui ComfyUI terlebih dahulu. Jika Anda menggunakan build portable dari GitHub, ambil rilis terbaru atau git pull dan jalankan skrip pembaruan.
Buka ComfyUI Manager (jika Anda menggunakannya) dan perbarui dependensi inti. Saya membiarkan Manager membangun kembali venv saat diminta.
Instal paket node LTX-2 dari repositori resminya. Nama bervariasi (saya telah melihat gaya repo “ComfyUI-LTXVideo”/“LTX-Video”): saya menggunakan yang ditautkan dari halaman model resmi. Jika deskripsi repo mengatakan itu mendukung LTX-Video v2/LTX-2, itulah yang Anda inginkan.

Mengapa ini penting dalam praktik:

LTX-2 bergantung pada fitur PyTorch 2.3+ dan build CUDA 12.x. Mencampur torch lama (cu118) dengan node baru adalah cara cepat untuk mengalami kesalahan impor kriptik.
Beberapa paket mengekspos toggle FP8/BF16 secara berbeda. Mencocokkan paket node dan versi ComfyUI menghindari input yang tidak cocok dan graf jalan buntu.

Saya menolak instalasi segar pada awalnya, terasa tidak perlu. Kemudian saya membandingkan: build baru dimulai pada percobaan pertama; yang lebih lama terus meminta ops yang hilang. Saya tidak kehilangan tebakan.

Penempatan File Model (langkah demi langkah)

Di sinilah saya biasanya menghabiskan waktu. Node berbeda mengharapkan folder berbeda. Inilah yang berhasil untuk saya dengan paket node LTX-2 yang saya instal, dan pola umum tetap berlaku bahkan jika nama folder Anda berbeda.

Temukan jalur yang diharapkan node. Di ComfyUI, buka node pemuat LTX dan arahkan ke input file apa pun. Sebagian besar paket menunjukkan jalur relatif yang mereka pindai (misalnya, models/ltx, models/checkpoints, atau subfolder khusus seperti models/ltx_video). Jika ragu, periksa README repo. Mereka biasanya mencantumkan direktori yang tepat.
Unduh bobot LTX-2 dari sumber resmi (sering kali Hugging Face, ditautkan dari halaman model). Anda biasanya akan mendapatkan file .safetensors atau .pth utama ditambah konfigurasi. Beberapa repo membagi encoder teks/VAE secara terpisah; yang lain menggabungkannya.
Tempatkan file tepat di tempat node mencari. Untuk paket saya: ComfyUI/models/ltx_video/ berisi file model utama. Jika paket Anda mengatakan models/checkpoints, gunakan sebaliknya. Nama harus muncul di dropdown node setelah restart atau pemindaian ulang.
Opsional: encoder teks / VAE. Jika node mengekspos input terpisah untuk encoder atau VAE, ikuti panduan. Banyak node LTX-2 menyembunyikan ini dan menggabungkan komponen secara internal. Jika diekspos, letakkan file CLIP/Tokenizer di models/clip atau models/text_encoders seperti yang diperintahkan oleh README.
Restart ComfyUI. Saya tahu, itu jelas. Tetapi hot-reloading tidak selalu memindai ulang folder ini, dan saya telah menatap dropdown kosong lebih banyak waktu daripada yang akan saya akui.

Catatan kecil: jika Windows menandai file yang diunduh sebagai diblokir (klik kanan > Properties > Unblock), hapus itu. Saya telah memiliki Python menolak menyentuh file “diunduh dari internet” dalam pengaturan yang lebih ketat.

Kesalahan Windows Umum (DLL / izin)

“DLL load failed while importing …” atau hilang nvrtc64_X.dll

Penyebab: Build PyTorch tidak cocok dengan runtime CUDA yang diharapkan oleh paket node, atau lingkungan mencampur cu118 dan cu12x.
Perbaikan: Pasang kembali/konfirmasikan PyTorch 2.3+ dengan cu121/cu122 di dalam lingkungan ComfyUI. Jika Anda menjalankan portable, biarkan Manager menanganinya. Memperbarui driver NVIDIA membantu sekali. “Access is denied” saat menulis frame/video
Penyebab: Saya menunjukkan node SaveVideo ke folder yang disinkronkan dengan izin agresif (OneDrive).
Perbaikan: Tulis ke jalur lokal yang tidak disinkronkan terlebih dahulu (misalnya, ComfyUI/output/ltx_test). Pindahkan file nanti.

Masalah jalur panjang pada unzip

Penyebab: Batas panjang jalur Windows ditambah subfolder ComfyUI yang dalam.
Perbaikan: Aktifkan jalur panjang di Windows (Local Group Policy atau registry) atau unzip lebih dekat ke C:\.

Antivirus memindai frame sementara di tengah-render

Gejala: Hang atau stutter ComfyUI selama encode.
Perbaikan: Tambahkan pengecualian untuk folder ComfyUI atau hanya jalur output sementara.

“Could not find model” meskipun folder benar

Perbaikan: Restart ComfyUI. Jika masih tidak menampilkan, periksa folder yang diharapkan node secara tepat. Beberapa node LTX-2 mencari di nama direktori khusus. Cocokkan persis.

Saya juga menemui klasik “bekerja sekali, gagal lari berikutnya.” Untuk saya, itu muncul ke tab browser yang mencoba mempratinjau MP4 parsial sementara node encode masih menulis. Saya beralih ke penulisan nama file segar per run. Ketidakstabilan hilang.

Alur Kerja Tes Inferensi Pertama

Saya menjaga graf pertama tetap kecil. Tidak ada yang pintar, hanya cukup untuk mengonfirmasi pipeline.

Yang saya bangun:

Node Prompt dengan satu kalimat (10–20 token). Jaga agar tetap sederhana.
Node Pemuat LTX-2 menunjuk ke model yang diunduh.
Node LTX-2 Sampler/Scheduler (apa pun yang paket Anda namakan) dengan langkah rendah.
Jalur Video Decode/Assemble yang menulis frame ke node SaveVideo (MP4, H.264 baik-baik saja untuk tes asap).

Parameter yang tidak melawan saya:

Resolusi: 512×288 atau 640×360
Frame: 8–16 frame (0,5–1 detik)
Langkah: 6–12
Guidance/CFG: pertengahan (5–7)
Seed: nomor tetap (membuat troubleshooting kurang bising)
Presisi: FP16 (default) kecuali node Anda menyarankan BF16 di Ada: keduanya bekerja untuk saya, FP16 menggunakan lebih sedikit VRAM

Yang saya perhatikan pada run pertama:

Lonjakan VRAM di nvidia-smi. Jika Anda mencapai 99% VRAM seketika, turunkan resolusi atau frame.
Waktu ke frame pertama. Lari bersih pertama saya adalah ~25–40 detik untuk 16 frame pada 512×288 di 4070, langkah=8. Apa pun yang jauh lebih lama biasanya menunjuk ke encode CPU atau bottleneck I/O.

Jika render selesai tetapi video kosong atau rusak, coba:

Menulis frame PNG terlebih dahulu, kemudian membiarkan node terpisah atau alat eksternal merakit video.
Beralih ke encoder berbeda (H.264 vs H.265) atau nilai CRF.

Bagian yang berguna bukan kecepatan, tetapi melihat satu klip kohesif. Itulah saat saya santai. Kemudian saya scale up dengan hati-hati.

Tuning Performa (batch / presisi)

Saya tidak mengejar kemuliaan benchmark. Saya hanya menginginkan pengaturan yang menghentikan saya dari mengasuh memori.

Apa yang menggerakkan jarum:

Frame sebelum lebar. Lebih mudah di VRAM untuk menjaga 12–16 frame dan menaikkan lebar menjadi 640 daripada melompat ke 24+ frame. Klip yang lebih lama naik cepat dalam memori.
Presisi: FP16 bekerja terbaik di 4070 saya. BF16 juga bekerja tetapi menggunakan sedikit lebih banyak memori. Saya tidak mendapatkan kualitas terlihat dari BF16 pada ukuran ini.
Backend perhatian: Jika paket Anda mengekspos toggle untuk scaled_dot_product_attention (asli PyTorch) vs xFormers, coba asli dulu di PyTorch baru. Lebih stabil untuk saya di Windows.
Ukuran batch: Jaga pada 1 untuk video. Mini-batch sebagian besar menghukum VRAM tanpa menghemat waktu dinding di setup saya.
Torch compile: Patut dicoba, tetapi saya hanya melihat keuntungan kecil untuk run lebih lama. Untuk tes frame pendek 8–16, waktu compile bisa memakan penghematan.
I/O Campuran: Menulis ke SSD lokal cepat penting lebih dari yang saya harapkan. Folder jaringan lambat membuat fase encode terlihat seperti masalah model padahal tidak.

Tangga sederhana yang tidak meledak VRAM untuk saya:

512×288, 12 frame, langkah=8
640×360, 16 frame, langkah=10
768×432, 16–24 frame, langkah=12–14

Jika Anda kekurangan memori:

Turunkan frame sebesar 4 sebelum menurunkan lebar.
Kurangi langkah terlebih dahulu jika Anda hanya memerlukan draft.
Tutup aplikasi GPU lain (pemutar video, browser dengan akselerasi hardware). Membosankan, tetapi berhasil.

Saya juga mencoba mode ubin/patch kecil yang ditawarkan beberapa paket. Itu membantu pada lebar yang lebih tinggi tetapi kadang-kadang memperkenalkan jahitan. Baik untuk eksperimen: bukan default saya.

Jalur WaveSpeed (tidak perlu CUDA lokal)

Saya menguji satu run melalui jalur yang dihosting untuk menghindari shuffle GPU. Idenya: biarkan ComfyUI berbicara dengan pekerja jarak jauh yang menjalankan LTX-2, jadi kotak Windows lokal Anda hanya menangani UI graf.

Seperti apa ini dalam praktik:

Instal konektor/ekstensi di ComfyUI (yang saya gunakan melabeli dirinya “WaveSpeed” dalam daftar Manager). Setelah install, serangkaian node baru muncul untuk eksekusi jarak jauh.
Autentikasi atau tunjukkan ke endpoint pekerja. Milik saya menggunakan kunci dashboard. Setup memakan waktu beberapa menit.
Tukar pemuat/sampler LTX-2 lokal dengan yang setara WaveSpeed. Prompt yang sama, bentuk graf yang sama, hanya node berbeda.

Lewati kerepotan setup: Uji LTX-2 secara instan di WaveSpeed — tidak ada GPU lokal, tidak ada driver juggling, hanya masukkan prompt dan mulai render.

Jika Anda penasaran, periksa dokumentasi resmi konektor untuk langkah setup saat ini. Saya tidak akan membangun kembali seluruh alur kerja saya di sekitar ini, tetapi sebagai jalur tanpa CUDA, itu menyegarkan membosankan, dengan cara yang baik.