Расширение ComfyUI-LTXVideo: поддержка LoRA, рабочие процессы и когда оно нужно
title: “Расширение ComfyUI-LTXVideo: поддержка LoRA, рабочие процессы и когда они нужны” date: “2026-01-13” author: “Dora” description: “Практический взгляд на LTXVideo в ComfyUI—что встроено, что добавляет расширение и как это меняет реальные видеорабочие процессы.” cover: “https://d8r3hf7cxo9nn.cloudfront.net/cms/2026-01-13/20260113024313_tipbhf0t.png”
В первый раз, когда я попробовал ComfyUI LTXVideo, я не охотился за новыми функциями. Мне просто нужен был надёжный способ превратить грубый раскадровку в движение без контроля каждого кадра. Моя небольшая проблема: ещё одна ошибка “missing node” после долгого дня. Я чуть не закрыл окно. Вместо этого я дал ему неделю (начало января 2026) и запустил его на нескольких реальных проектах: 12-секундный продуктовый цикл, обучающий фрагмент для курса и один из тех экспериментов по превращению текстуры в движение, которые либо выглядят умно, либо проклято. Я обнаружил, что это не волшебство. Но это сделало работу более лёгкой в нескольких тихих местах. Обычно это сигнал, на который я смотрю.
Встроенная версия vs расширение: в чём разница
Я всё время слышал, как люди говорят о “поддержке LTXVideo в ComfyUI”, но было непонятно, что встроено, а что требует дополнительных частей. Вот что я заметил на практике.
- Встроенная версия (ComfyUI base): Вы можете подключить общие потоки text-to-image/video, планировать семплеры и управлять кондиционированием. Базовое приложение надёжно для маршрутизации данных, предпросмотра кадров и сохранения воспроизводимости запусков. Но по умолчанию оно не поставляется со специализированными узлами LTX-Video.

- Расширение (пользовательские узлы LTXVideo): Это добавляет узлы, осведомлённые о модели (загрузчики, семплеры, блоки кондиционирования), построенные вокруг архитектуры LTX-Video. Расширение понимает длину движения модели, контекстные окна и небольшие ограничения, которые не переводятся в универсальные узлы.
Разница проявляется, когда вы пытаетесь делать меньше ручного соединения. Только с основными узлами я жонглировал формами тензоров, угадывал значения по умолчанию и натыкался на несовпадения форм. С установленным расширением граф стал короче и ошибок стало меньше. Мне всё ещё пришлось думать, просто не о сантехнике.
Небольшой пример: я создал цикл продолжительностью 8–12 секунд с согласованным освещением сцены. Только встроенная версия заняла у меня ~45 минут на установку: позвольте мне сказать, что версия с расширением работала чисто со второй попытки (около 15 минут), потому что предварительно подключённый семплер и видеосборщик обрабатывали выравнивание кадров без моего вмешательства.
Итак, если вы оцениваете: встроенной версии достаточно, если вам нравится полный контроль и вы не против подключения. Расширение нужно, когда вы заботитесь о воспроизводимых запусках больше, чем о ручно настроенных трубопроводах.
Что добавляет расширение (рабочие процессы / узлы / LoRA)
Я не ожидал много, когда кликнул на примеры графов, я видел слишком много “стартовых” рабочих процессов, которые в основном представляют собой скриншоты. Эти были лучше.
Что мне помогло:
- Специализированные узлы: загрузчик модели для LTX-Video, селектор длины движения, который избегает странного количества кадров, и семплер, который уважает оптимальные временные интервалы модели. Они устраняют несколько подводных камней, которые обычно появляются только после неудачного рендера.
- Примеры рабочих процессов: Три, к которым я постоянно возвращался: базовый text-to-video, image-to-video с внедрением движения и передача стиля с использованием LoRA. Каждый достаточно ясен для начала, но не такой жёсткий, чтобы вы не могли поменять части.
- Крючки LoRA: Расширение чисто открывает силу и комбинацию LoRA. Я мог наложить стиль LoRA с лёгким identity LoRA и при этом сохранить стабильное движение. Я должен сказать, что это редко на ранних видеоустановках.
Одно небольшое удивление: обработка цвета по умолчанию выглядела спокойнее, чем большинство открытых видеомоделей, которые я пробовал. Синий цвет не взорвался. Кожа оставалась в приемлемом диапазоне. Мне всё ещё пришлось подправить экспозицию, но я не тушил пожар насыщенности.
Ограничения, которые я обнаружил:
- Длинные последовательности (более ~12–16 секунд) дрейфовали, если я не вводил якорные ключевые кадры или не разбивал запуск. Это нормально на этом этапе, но стоит отметить.
- Тяжёлая укладка LoRA может колебать движение. Два в порядке, три неудачны, если только вы не снижаете силы.
Шаги установки и обновления
Подготовка
- Обновите ComfyUI до последней версии. Я использовал ночную версию января 2026 на обеих машинах.
- Python 3.10–3.11 работал лучше всего. Я держал свежий venv на каждой машине.
Установите расширение LTXVideo
- Используйте ComfyUI-Manager, если у вас есть: найдите “LTXVideo” или “ComfyUI-LTXVideo” и установите.

- Ручной маршрут: клонируйте репо в ComfyUI/custom_nodes. Затем установите требования (
pip install -r requirements.txt) в вашей среде.
Модели
- Поместите контрольные точки LTX-Video туда, где их ожидает расширение. Большинство версий ищут
models/ltxvideoилиmodels/checkpoints: узел обычно подсказывает точный путь при наведении. - Если вы используете LoRA, поместите их в
models/loras(или где бы узел не указывал значение по умолчанию).
CUDA и среды выполнения
- Linux с CUDA 12.x и PyTorch 2.3+ работал гладко. На macOS Metal работал, но я держал размеры пакетов маленькими.
- Если вы видите всплески памяти при первом запуске, уменьшите длину движения или установите меньшую точность декодирования, если узел её открывает.
Обновления
- Получите последнюю версию из репо расширения. Переустановите требования, когда прибывают крупные коммиты (я столкнулся с одним несовпадением torch-vision и бампом protobuf: оба исправлены чистой переустановкой).
- Очистите кэш ComfyUI, если узлы не появляются после обновления. Быстрый перезапуск часто разрешает устаревший импорт.
Временные затраты: первая установка заняла у меня ~20 минут на чистый Linux, ~30 минут на macOS, потому что мне пришлось повторно связать несколько metal сборок. Обновления были минутами, если только зависимости не изменились.
Прохождение примеров рабочих процессов
Я запустил три рабочих процесса по несколько раз каждый, настраивая ровно столько, чтобы увидеть, насколько они стабильны.
1. Text-to-video (базовый)
- Установка: подсказка, отрицательная подсказка, загрузчик LTX-Video, семплер модели и видеозаписывающее устройство при 512–768 на коротком краю. Я держал длину движения 8–12 секунд.
- Наблюдения: первый проход редко попадал в точный темп, но дал мне стабильный “базовый дубль”. Второй проход с небольшими правками подсказки исправил большинство проблем. Каждый рендер занял 2–4 минуты на A6000, ~6–8 на M3 Max.
- Небольшой совет: если движение выглядит плавающим, затяните временное руководство или уменьшите CFG на один. Для меня 4,5–6,5 был приемлемым диапазоном.
2. Image-to-video с внедрением движения
- Установка: одно эталонное изображение плюс LoRA стиля низкой силы для сохранения согласованности текстуры. Я использовал узел движения расширения, чтобы подтолкнуть дрейф камеры вместо того, чтобы позволить ему придумывать движение.
- Наблюдения: это не сэкономило время с первой попытки, я переусложил. На третьем запуске я понял, что это снизило умственную нагрузку: меньше артефактов для сортировки, меньше сюрпризов “что это в углу?”.
- Практическое примечание: если объект деформируется около кадра 3–5, добавьте изображение подсказки в середине последовательности или якорный кадр. Я использовал два якоря для 10-секундного клипа, и это выглядело зафиксированным.
3. Стиль с LoRA (плюс лёгкий identity)
- Установка: базовая подсказка, один стиль LoRA при 0,6–0,8, identity LoRA при 0,2–0,3 и консервативное движение.
- Наблюдения: комбинация держалась лучше, чем я ожидал. Сильнее, чем 0,8 на стиле, начал “блестеть” текстуры, хороший для постеров, странный для движения. Сохранение identity низко избежало жуткие сдвиги.
- Экспорт: я писал в ProRes для градации. H.264 хорош для быстрых проверок, но цвета выглядели лучше, когда я сделал лёгкий проход в Resolve.
Во всех запусках я экономил, возможно, 15–20 минут на клип по сравнению со сшиванием универсальных узлов. Большой выигрыш был меньше перезапусков. Меньше возиться, больше решать.
Основы LoRA и IC-LoRA
Я обычно беру LoRA только когда они мне нужны. С LTXVideo они стоят дополнительного шага, особенно для согласованности.
- LoRA: думайте об этом как о лёгком стилистическом отпечатке. В видео, толкайте осторожно. Силы более ~0,8 выглядят хрупкими по мере накопления движения.
- Identity LoRA: полезно для сохранения персонажа или продукта стабильным во всех кадрах. Мне нравились значения в диапазоне 0,15–0,35.
- IC-LoRA (image-conditioned LoRA): здесь я нашел наибольшую практическую ценность. Подача чистого эталонного изображения в IC-LoRA стабилизировала детали (логотипы, лица) без замораживания сцены. Я использовал одно чёткое лицевое изображение и иногда боковой угол как вторичный сигнал.
Что важно на практике:
- Чистые ссылки превосходят умные подсказки. Мусор на входе, мусор на выходе, и это проявляется в движении.
- Смешивайте меньше, настраивайте легче. Два LoRA с лёгким применением работали лучше, чем три борющихся друг с другом.
- Пересеивайте, если появляется микро-дрожание. Новое семя плюс те же якоря часто решали крошечное мерцание лица.
Исправления “Missing Node”
Я столкнулся с тремя типами “missing node” при тестировании. Ни один не был драматичным, но они прерывают поток.
- Расширение не загружено: убедитесь, что папка LTXVideo находится под
ComfyUI/custom_nodesи что у неё есть__init__.py. Перезагрузите ComfyUI. Если в журнале показаны ошибки импорта, переустановите требования для этого узла. - Дрейф зависимостей: несовпадения Torch/CUDA появляются как ошибки импорта. Выровняйте версии PyTorch и CUDA, перечисленные в README расширения. Свежий venv быстрее, чем отладка запутанного.
- Старые рабочие процессы, новые узлы: некоторые графы ссылаются на переименованные узлы. Откройте JSON, найдите класс узла и сопоставьте его с новым именем. CHANGELOG расширения обычно отмечают эти.
Быстрые проверки здравомыслия:
- Обновите ComfyUI-Manager, затем “сканируйте обновления”.
- Очистите кэш ComfyUI и перезагрузитесь.
- Подтвердите пути к моделям в узле загрузки, отсутствующая контрольная точка выглядит как отсутствующий узел с точки зрения пользовательского интерфейса.
Применение этих рабочих процессов на WaveSpeed
Я попробовал облачный запуск, чтобы увидеть, как это переводится с моего стола. На WaveSpeed я запустил рабочее пространство ComfyUI с GPU класса RTX и нарушил расширение LTXVideo так же.
Два примечания, если вы пойдёте по этому маршруту:
- Держите ваши модели организованными: я синхронизировал контрольные точки LTX-Video и LoRA в ожидаемые папки (
models/ltxvideo,models/loras) первыми, затем открыл примеры графов. Поверьте мне, никаких неожиданностей после совпадения путей. - Длины запусков: облачный GPU позволил мне тестировать клипы продолжительностью 12–16 секунд при более высоком разрешении без потливости VRAM. Это не исправило дрейф само по себе, но сделало итерацию быстрее, я мог вывести три дубля параллельно и выбрать хранителя.
Если вы работаете на ноутбуке, это низконапряжённый способ протестировать идеи перед тем, как приступить к локальным установкам. Ваш пробег может отличаться, но это спасло меня от нескольких ночных циклов компиляции.
Небольшая, остающаяся мысль: LTXVideo внутри ComfyUI не пытается впечатлить вас с первого взгляда. Это просто сокращает количество вещей, которые вы должны держать в голове одновременно. В занятые дни этого достаточно.





