Расширение ComfyUI-LTXVideo: поддержка LoRA, рабочие процессы и когда оно нужно

title: “Расширение ComfyUI-LTXVideo: поддержка LoRA, рабочие процессы и когда они нужны” date: “2026-01-13” author: “Dora” description: “Практический взгляд на LTXVideo в ComfyUI—что встроено, что добавляет расширение и как это меняет реальные видеорабочие процессы.” cover: “https://d8r3hf7cxo9nn.cloudfront.net/cms/2026-01-13/20260113024313_tipbhf0t.png”

В первый раз, когда я попробовал ComfyUI LTXVideo, я не охотился за новыми функциями. Мне просто нужен был надёжный способ превратить грубый раскадровку в движение без контроля каждого кадра. Моя небольшая проблема: ещё одна ошибка “missing node” после долгого дня. Я чуть не закрыл окно. Вместо этого я дал ему неделю (начало января 2026) и запустил его на нескольких реальных проектах: 12-секундный продуктовый цикл, обучающий фрагмент для курса и один из тех экспериментов по превращению текстуры в движение, которые либо выглядят умно, либо проклято. Я обнаружил, что это не волшебство. Но это сделало работу более лёгкой в нескольких тихих местах. Обычно это сигнал, на который я смотрю.

Встроенная версия vs расширение: в чём разница

Я всё время слышал, как люди говорят о “поддержке LTXVideo в ComfyUI”, но было непонятно, что встроено, а что требует дополнительных частей. Вот что я заметил на практике.

Встроенная версия (ComfyUI base): Вы можете подключить общие потоки text-to-image/video, планировать семплеры и управлять кондиционированием. Базовое приложение надёжно для маршрутизации данных, предпросмотра кадров и сохранения воспроизводимости запусков. Но по умолчанию оно не поставляется со специализированными узлами LTX-Video.
Расширение (пользовательские узлы LTXVideo): Это добавляет узлы, осведомлённые о модели (загрузчики, семплеры, блоки кондиционирования), построенные вокруг архитектуры LTX-Video. Расширение понимает длину движения модели, контекстные окна и небольшие ограничения, которые не переводятся в универсальные узлы.

Разница проявляется, когда вы пытаетесь делать меньше ручного соединения. Только с основными узлами я жонглировал формами тензоров, угадывал значения по умолчанию и натыкался на несовпадения форм. С установленным расширением граф стал короче и ошибок стало меньше. Мне всё ещё пришлось думать, просто не о сантехнике.

Небольшой пример: я создал цикл продолжительностью 8–12 секунд с согласованным освещением сцены. Только встроенная версия заняла у меня ~45 минут на установку: позвольте мне сказать, что версия с расширением работала чисто со второй попытки (около 15 минут), потому что предварительно подключённый семплер и видеосборщик обрабатывали выравнивание кадров без моего вмешательства.

Итак, если вы оцениваете: встроенной версии достаточно, если вам нравится полный контроль и вы не против подключения. Расширение нужно, когда вы заботитесь о воспроизводимых запусках больше, чем о ручно настроенных трубопроводах.

Что добавляет расширение (рабочие процессы / узлы / LoRA)

Я не ожидал много, когда кликнул на примеры графов, я видел слишком много “стартовых” рабочих процессов, которые в основном представляют собой скриншоты. Эти были лучше.

Что мне помогло:

Специализированные узлы: загрузчик модели для LTX-Video, селектор длины движения, который избегает странного количества кадров, и семплер, который уважает оптимальные временные интервалы модели. Они устраняют несколько подводных камней, которые обычно появляются только после неудачного рендера.
Примеры рабочих процессов: Три, к которым я постоянно возвращался: базовый text-to-video, image-to-video с внедрением движения и передача стиля с использованием LoRA. Каждый достаточно ясен для начала, но не такой жёсткий, чтобы вы не могли поменять части.
Крючки LoRA: Расширение чисто открывает силу и комбинацию LoRA. Я мог наложить стиль LoRA с лёгким identity LoRA и при этом сохранить стабильное движение. Я должен сказать, что это редко на ранних видеоустановках.

Одно небольшое удивление: обработка цвета по умолчанию выглядела спокойнее, чем большинство открытых видеомоделей, которые я пробовал. Синий цвет не взорвался. Кожа оставалась в приемлемом диапазоне. Мне всё ещё пришлось подправить экспозицию, но я не тушил пожар насыщенности.

Ограничения, которые я обнаружил:

Длинные последовательности (более ~12–16 секунд) дрейфовали, если я не вводил якорные ключевые кадры или не разбивал запуск. Это нормально на этом этапе, но стоит отметить.
Тяжёлая укладка LoRA может колебать движение. Два в порядке, три неудачны, если только вы не снижаете силы.

Шаги установки и обновления

Подготовка

Обновите ComfyUI до последней версии. Я использовал ночную версию января 2026 на обеих машинах.
Python 3.10–3.11 работал лучше всего. Я держал свежий venv на каждой машине.

Установите расширение LTXVideo

Используйте ComfyUI-Manager, если у вас есть: найдите “LTXVideo” или “ComfyUI-LTXVideo” и установите.
Ручной маршрут: клонируйте репо в ComfyUI/custom_nodes. Затем установите требования (pip install -r requirements.txt) в вашей среде.

Модели

Поместите контрольные точки LTX-Video туда, где их ожидает расширение. Большинство версий ищут models/ltxvideo или models/checkpoints: узел обычно подсказывает точный путь при наведении.
Если вы используете LoRA, поместите их в models/loras (или где бы узел не указывал значение по умолчанию).

CUDA и среды выполнения

Linux с CUDA 12.x и PyTorch 2.3+ работал гладко. На macOS Metal работал, но я держал размеры пакетов маленькими.
Если вы видите всплески памяти при первом запуске, уменьшите длину движения или установите меньшую точность декодирования, если узел её открывает.

Обновления

Получите последнюю версию из репо расширения. Переустановите требования, когда прибывают крупные коммиты (я столкнулся с одним несовпадением torch-vision и бампом protobuf: оба исправлены чистой переустановкой).
Очистите кэш ComfyUI, если узлы не появляются после обновления. Быстрый перезапуск часто разрешает устаревший импорт.

Временные затраты: первая установка заняла у меня ~20 минут на чистый Linux, ~30 минут на macOS, потому что мне пришлось повторно связать несколько metal сборок. Обновления были минутами, если только зависимости не изменились.

Прохождение примеров рабочих процессов

Я запустил три рабочих процесса по несколько раз каждый, настраивая ровно столько, чтобы увидеть, насколько они стабильны.

1. Text-to-video (базовый)

Установка: подсказка, отрицательная подсказка, загрузчик LTX-Video, семплер модели и видеозаписывающее устройство при 512–768 на коротком краю. Я держал длину движения 8–12 секунд.
Наблюдения: первый проход редко попадал в точный темп, но дал мне стабильный “базовый дубль”. Второй проход с небольшими правками подсказки исправил большинство проблем. Каждый рендер занял 2–4 минуты на A6000, ~6–8 на M3 Max.
Небольшой совет: если движение выглядит плавающим, затяните временное руководство или уменьшите CFG на один. Для меня 4,5–6,5 был приемлемым диапазоном.

2. Image-to-video с внедрением движения

Установка: одно эталонное изображение плюс LoRA стиля низкой силы для сохранения согласованности текстуры. Я использовал узел движения расширения, чтобы подтолкнуть дрейф камеры вместо того, чтобы позволить ему придумывать движение.
Наблюдения: это не сэкономило время с первой попытки, я переусложил. На третьем запуске я понял, что это снизило умственную нагрузку: меньше артефактов для сортировки, меньше сюрпризов “что это в углу?”.
Практическое примечание: если объект деформируется около кадра 3–5, добавьте изображение подсказки в середине последовательности или якорный кадр. Я использовал два якоря для 10-секундного клипа, и это выглядело зафиксированным.

3. Стиль с LoRA (плюс лёгкий identity)

Установка: базовая подсказка, один стиль LoRA при 0,6–0,8, identity LoRA при 0,2–0,3 и консервативное движение.
Наблюдения: комбинация держалась лучше, чем я ожидал. Сильнее, чем 0,8 на стиле, начал “блестеть” текстуры, хороший для постеров, странный для движения. Сохранение identity низко избежало жуткие сдвиги.
Экспорт: я писал в ProRes для градации. H.264 хорош для быстрых проверок, но цвета выглядели лучше, когда я сделал лёгкий проход в Resolve.

Во всех запусках я экономил, возможно, 15–20 минут на клип по сравнению со сшиванием универсальных узлов. Большой выигрыш был меньше перезапусков. Меньше возиться, больше решать.

Основы LoRA и IC-LoRA

Я обычно беру LoRA только когда они мне нужны. С LTXVideo они стоят дополнительного шага, особенно для согласованности.

LoRA: думайте об этом как о лёгком стилистическом отпечатке. В видео, толкайте осторожно. Силы более ~0,8 выглядят хрупкими по мере накопления движения.
Identity LoRA: полезно для сохранения персонажа или продукта стабильным во всех кадрах. Мне нравились значения в диапазоне 0,15–0,35.
IC-LoRA (image-conditioned LoRA): здесь я нашел наибольшую практическую ценность. Подача чистого эталонного изображения в IC-LoRA стабилизировала детали (логотипы, лица) без замораживания сцены. Я использовал одно чёткое лицевое изображение и иногда боковой угол как вторичный сигнал.

Что важно на практике:

Чистые ссылки превосходят умные подсказки. Мусор на входе, мусор на выходе, и это проявляется в движении.
Смешивайте меньше, настраивайте легче. Два LoRA с лёгким применением работали лучше, чем три борющихся друг с другом.
Пересеивайте, если появляется микро-дрожание. Новое семя плюс те же якоря часто решали крошечное мерцание лица.

Исправления “Missing Node”

Я столкнулся с тремя типами “missing node” при тестировании. Ни один не был драматичным, но они прерывают поток.

Расширение не загружено: убедитесь, что папка LTXVideo находится под ComfyUI/custom_nodes и что у неё есть __init__.py. Перезагрузите ComfyUI. Если в журнале показаны ошибки импорта, переустановите требования для этого узла.
Дрейф зависимостей: несовпадения Torch/CUDA появляются как ошибки импорта. Выровняйте версии PyTorch и CUDA, перечисленные в README расширения. Свежий venv быстрее, чем отладка запутанного.
Старые рабочие процессы, новые узлы: некоторые графы ссылаются на переименованные узлы. Откройте JSON, найдите класс узла и сопоставьте его с новым именем. CHANGELOG расширения обычно отмечают эти.

Быстрые проверки здравомыслия:

Обновите ComfyUI-Manager, затем “сканируйте обновления”.
Очистите кэш ComfyUI и перезагрузитесь.
Подтвердите пути к моделям в узле загрузки, отсутствующая контрольная точка выглядит как отсутствующий узел с точки зрения пользовательского интерфейса.

Применение этих рабочих процессов на WaveSpeed

Я попробовал облачный запуск, чтобы увидеть, как это переводится с моего стола. На WaveSpeed я запустил рабочее пространство ComfyUI с GPU класса RTX и нарушил расширение LTXVideo так же. Два примечания, если вы пойдёте по этому маршруту:

Держите ваши модели организованными: я синхронизировал контрольные точки LTX-Video и LoRA в ожидаемые папки (models/ltxvideo, models/loras) первыми, затем открыл примеры графов. Поверьте мне, никаких неожиданностей после совпадения путей.
Длины запусков: облачный GPU позволил мне тестировать клипы продолжительностью 12–16 секунд при более высоком разрешении без потливости VRAM. Это не исправило дрейф само по себе, но сделало итерацию быстрее, я мог вывести три дубля параллельно и выбрать хранителя.

Если вы работаете на ноутбуке, это низконапряжённый способ протестировать идеи перед тем, как приступить к локальным установкам. Ваш пробег может отличаться, но это спасло меня от нескольких ночных циклов компиляции.

Небольшая, остающаяся мысль: LTXVideo внутри ComfyUI не пытается впечатлить вас с первого взгляда. Это просто сокращает количество вещей, которые вы должны держать в голове одновременно. В занятые дни этого достаточно.