Установка LTX-2 в ComfyUI на Windows: руководство по настройке CUDA и первому запуску

Установка LTX-2 в ComfyUI на Windows: руководство по настройке CUDA и первому запуску

Привет, я Дора. В тот день я просто хотела быстро сделать проход text-to-video для скетча, и я постоянно видела упоминания LTX-2 в ветках ComfyUI. К середине утра я стояла перед пустым графом и папкой с названием “ltx” и задавалась вопросом, не подписалась ли я снова на русскую рулетку драйверов.

Я делала заметки, пока настраивала это на Windows 11. Если вы ищете “ltx-2 comfyui windows” потому что находитесь в процессе установки, я была в такой же ситуации. Вот что помогло.


Чек-лист перед установкой (GPU / CUDA / версии драйверов)

Быстрая проверка перед началом сэкономит час, который вы потратите на отладку ошибок DLL позже:

  • GPU: видеокарта NVIDIA с минимум 12 ГБ VRAM сделала LTX-2 приемлемым для меня при скромных настройках (512–768 ширина, короткие клипы). 8 ГБ может работать с очень консервативными настройками, но это тесно и часто разочаровывает.
  • Драйверы: обновитесь до свежего Game Ready или Studio драйвера (я использовала 552.xx).
  • CUDA: вы не устанавливаете полный CUDA toolkit для ComfyUI portable. Вам нужны только runtime DLL, которые поставляются с PyTorch. Вот почему важно совпадение PyTorch+CUDA сборки (cu121 или cu122 и т.д.).
  • Python: комплектная сборка ComfyUI поставляется с собственным Python. Если вы используете пользовательский venv, держите его согласованным с выбранным вами колесом PyTorch.
  • VC++ Redistributable: установите/отремонтируйте последний Microsoft Visual C++ Redistributable. Это тихое решение для ошибок DLL типа “procedure entry point”.

Два теста на здравый смысл, которые я делаю перед любой тяжелой моделью:

  1. nvidia-smi запускается в терминале и чисто показывает драйвер.
  2. python -c "import torch: print(torch.version, torch.cuda.is_available())" возвращает True для CUDA в той среде, которая будет использоваться ComfyUI.

Ничто из этого не гарантирует гладкую работу, но это сужает возможные режимы отказа.


Обновите ComfyUI до версии, готовой к LTX-2

Что я делала:

  • Сначала обновите ComfyUI. Если вы работаете с комплектной сборкой с GitHub, возьмите последний релиз или выполните git pull и запустите скрипты обновления.
  • Откройте ComfyUI Manager (если вы его используете) и обновите основные зависимости. Я позволила Manager пересоздать venv, когда было предложено.
  • Установите пакет узлов LTX-2 из его официального репозитория. Название варьируется (я видела репозитории стиля “ComfyUI-LTXVideo”/“LTX-Video”): я использовала тот, который связан со страницы официальной модели. Если описание репозитория говорит, что он поддерживает LTX-Video v2/LTX-2, это то, что вам нужно.

Почему это важно на практике:

  • LTX-2 опирается на функции PyTorch 2.3+ и сборки CUDA 12.x. Смешивание старого torch (cu118) с новыми узлами — это быстрый способ попасть на криптические ошибки импорта.
  • Некоторые пакеты по-разному выставляют переключатели FP8/BF16. Совпадение пакета узлов и версии ComfyUI избегает неправильных входов и тупиковых графов.

Я сначала сопротивлялась свежей установке, она казалась ненужной. Потом я сравнила: новая сборка стартовала с первой попытки; старая всё ещё просила отсутствующие операции. Я не скучала по предположениям.


Размещение файлов модели (пошагово)

Здесь я обычно теряю время. Разные узлы ожидают разные папки. Вот что сработало для меня с установленным пакетом узлов LTX-2, и общий паттерн сохраняется, даже если названия ваших папок отличаются.

  1. Найдите ожидаемые пути узла.
    В ComfyUI откройте узел загрузки LTX и наведитесь на любой ввод файла. Большинство пакетов показывают относительный путь, который они сканируют (например, models/ltx, models/checkpoints, или пользовательскую подпапку вроде models/ltx_video).
    Если в сомнениях, проверьте README репозитория. Они обычно перечисляют точный каталог.

  2. Загрузите веса LTX-2 из официального источника (часто Hugging Face, связано со страницы модели).
    Вы обычно получите основной файл .safetensors или .pth плюс конфиги. Некоторые репозитории разделяют текстовые энкодеры/VAE отдельно; другие объединяют их.

  3. Поместите файлы точно туда, где узел их ищет.
    Для моего пакета: ComfyUI/models/ltx_video/ содержал основной файл модели. Если ваш пакет говорит models/checkpoints, используйте вместо этого. Название должно появиться в раскрывающемся списке узла после перезагрузки или пересканирования.

  4. Опционально: текстовый энкодер / VAE.
    Если узел выставляет отдельные входы для энкодеров или VAE, следуйте его рекомендациям. Многие узлы LTX-2 скрывают это и объединяют компоненты внутри. Если это выставлено, поместите файлы CLIP/Tokenizer в models/clip или models/text_encoders согласно инструкциям README.

  5. Перезагрузите ComfyUI.
    Я знаю, это очевидно. Но горячая перезагрузка не всегда пересканирует эти папки, и я смотрела на пустой раскрывающийся список больше раз, чем хочу признать.

Маленькое замечание: если Windows отмечает загруженные файлы как заблокированные (правый клик > Свойства > Разблокировать), очистите это. У меня Python отказывался трогать файлы “загруженные с интернета” в более строгих установках.


Типичные ошибки Windows (DLL / разрешения)

“DLL load failed while importing …” или отсутствует nvrtc64_X.dll

  • Причина: сборка PyTorch не совпадала с CUDA runtime, ожидаемым пакетом узлов, или среда смешивала cu118 и cu12x.
  • Решение: переустановите/подтвердите PyTorch 2.3+ с cu121/cu122 внутри окружения ComfyUI. Если вы используете portable, позвольте Manager справиться с этим. Обновление драйверов NVIDIA помогло однажды. “Access is denied” при записи кадров/видео
  • Причина: я указала узел SaveVideo на синхронизированную папку с агрессивными разрешениями (OneDrive).
  • Решение: сначала пишите на локальный не синхронизируемый путь (например, ComfyUI/output/ltx_test). Переместите файл позже.

Проблемы с длинными путями при распаковке

  • Причина: ограничения длины пути Windows плюс глубокие подпапки ComfyUI.
  • Решение: включите длинные пути в Windows (Local Group Policy или реестр) или распакуйте ближе к C:\.

Антивирус сканирует временные кадры во время рендера

  • Симптом: зависание или заикание ComfyUI во время кодирования.
  • Решение: добавьте исключение для папки ComfyUI или просто пути вывода временных файлов.

“Could not find model” хотя папка правильная

  • Решение: перезагрузите ComfyUI. Если всё ещё не показывается, проверьте точную ожидаемую папку узла. Некоторые узлы LTX-2 ищут в пользовательском имени каталога. Совпадите с ним точно.

Я также столкнулась с классической ситуацией “работает один раз, следующий раз падает”. Для меня это свелось к тому, что вкладка браузера пыталась предпросмотреть частичный MP4, пока узел кодирования ещё писал. Я переключилась на запись в новое имя файла за каждый запуск. Нестабильность исчезла.


Первый тестовый рабочий процесс вывода

Я держала первый граф маленьким. Ничего умного, просто достаточно, чтобы подтвердить конвейер.

Что я построила:

  • Узел Prompt с одним предложением (10–20 токенов). Держите это просто.
  • Узел загрузки LTX-2 указывающий на загруженную модель.
  • Узел LTX-2 Sampler/Scheduler (как его называет ваш пакет) с низким количеством шагов.
  • Путь декодирования/сборки видео, который записывает кадры в узел SaveVideo (MP4, H.264 хороший для быстрой проверки).

Параметры, которые со мной не боролись:

  • Разрешение: 512×288 или 640×360
  • Кадры: 8–16 кадров (0.5–1 секунда)
  • Шаги: 6–12
  • Guidance/CFG: золотая середина (5–7)
  • Seed: фиксированный номер (делает отладку менее шумной)
  • Точность: FP16 (по умолчанию) если ваш узел не предлагает BF16 на Ada: оба работали для меня, FP16 использовал меньше VRAM

На что я смотрю при первом запуске:

  • Скачки VRAM в nvidia-smi. Если вы сразу прижаты к 99% VRAM, уменьшите разрешение или кадры.
  • Время до первого кадра. Мой первый чистый запуск был ~25–40 секунд для 16 кадров на 512×288 на 4070, steps=8. Что-то намного более долгое обычно указывало на кодирование CPU или узкое место I/O.

Если ваш рендер завершается, но видео пусто или повреждено, попробуйте:

  • Сначала записать PNG кадры, потом позвольте отдельному узлу или внешнему инструменту собрать видео.
  • Переключиться на другой кодировщик (H.264 vs H.265) или значение CRF.

Полезная часть была не скорость, это было видеть один связный клип. Вот момент, когда я расслабляюсь. Потом я осторожно масштабирую.


Настройка производительности (batch / точность)

Я не гонялась за славой в бенчмарках. Я просто хотела настройки, которые не позволяли мне нянчиться с памятью.

Что дало результат:

  • Кадры перед шириной. Было проще для VRAM держать 12–16 кадров и увеличить ширину до 640, чем прыгать на 24+ кадра. Более длинные клипы быстро растут в памяти.
  • Точность: FP16 работала лучше всего на моей 4070. BF16 тоже работала, но использовала немного больше памяти. Я не получила видимого качества от BF16 при этих размерах.
  • Backend внимания: если ваш пакет выставляет переключатель для scaled_dot_product_attention (PyTorch native) vs xFormers, сначала попробуйте native на недавнем PyTorch. Для меня это было более стабильно на Windows.
  • Размер батча: держите его на 1 для видео. Мини-батчи в основном наказывали VRAM без экономии стенных часов на моей установке.
  • Torch compile: стоит тестирования, но я видела только небольшие выигрыши для более длительных запусков. Для коротких тестов 8–16 кадров, время компиляции могло съесть сбережения.
  • Смешанный IO: запись на быстрый локальный SSD имела большее значение, чем я ожидала. Медленные сетевые папки делали фазу кодирования похожей на проблему модели, когда это не было.

Простая лестница, которая не взорвала мою VRAM:

  1. 512×288, 12 кадров, steps=8
  2. 640×360, 16 кадров, steps=10
  3. 768×432, 16–24 кадра, steps=12–14

Если вы столкнулись с недостатком памяти:

  • Сначала уменьшите кадры на 4, прежде чем снижать ширину.
  • Сначала уменьшите шаги, если вам просто нужен черновик.
  • Закройте другие GPU приложения (видеоплееры, браузер с аппаратным ускорением). Утомительно, но это работает.

Я также пробовала крошечный режим tile/patch, который предлагают некоторые пакеты. Это помогло при большей ширине, но иногда вводило швы. Хорошо для экспериментов: не мой по умолчанию.


Путь WaveSpeed (CUDA не требуется локально)

Я протестировала один запуск через размещённый путь, чтобы избежать замешательства с GPU. Идея: позвольте ComfyUI общаться с удаленным рабочим процессом, который запускает LTX-2, так что ваш локальный ящик Windows просто обрабатывает UI графа.

Как это выглядело на практике:

  • Установите соединитель/расширение в ComfyUI (тот, который я использовала, обозначила себя как “WaveSpeed” в списке Manager). После установки появился новый набор узлов для удаленного выполнения.
  • Аутентифицируйтесь или укажите конечную точку рабочего процесса. Моя использовала ключ панели управления. Установка заняла несколько минут.
  • Замените локальный загрузчик/семплер LTX-2 на эквиваленты WaveSpeed. Те же подсказки, та же форма графа, только другие узлы.

Пропустите головные боли при установке: протестируйте LTX-2 мгновенно на WaveSpeed — никакого локального GPU, никакого жонглирования драйверами, просто введите вашу подсказку и начните рендеринг.

Если вы любопытны, проверьте официальную документацию соединителя для текущих шагов установки. Я бы не перестраивала весь свой рабочий процесс вокруг этого, но как путь без CUDA, это было освежающе скучно, в хорошем смысле.