Исправление ошибок LTX-2 в ComfyUI: решения для OOM, чёрных кадров и мерцания

Исправление ошибок LTX-2 в ComfyUI: решения для OOM, чёрных кадров и мерцания

Привет, это Дора. Я не планировала отлаживать LTX-2 в ComfyUI. Всё началось с небольшой паузы: чёрный экран предпросмотра после рабочего процесса, который я запускала десятки раз. Без громких сбоев. Просто… ничего. Я повторила попытку, смотрела на консоль, немного подкорректировала параметры. К концу недели (тестирование 6–10 января 2026) я собрала несколько повторяющихся исправлений. Это не грандиозный туториал, скорее заметки, которые я передала бы другу, пытающемуся заставить LTX-2 работать без переустановки драйверов с утра. Знаете, такой обычный хаос, который мы все хорошо знаем.

60-секундная диагностика (сопоставление симптомов и причин)

Когда LTX-2 ведёт себя странно в ComfyUI, быстрое сопоставление по образцам работает лучше, чем угадывание. Вот карта за 60 секунд, которую я проходлю, прежде чем что-то серьёзно менять:

Симптом: мерцание или дрейф кадра за кадром Вероятная причина: нестабильная направляющая (CFG слишком высокий), изменение seed, слишком сильные параметры движения. Быстрая попытка: зафиксируйте seed, понизьте CFG на один уровень, немного снизьте motion/denoise, добавьте шаг временной консистентности.

Симптом: странные сдвиги цвета, “снег” или растянутые блоки Вероятная причина: несовпадение весов/версии, неправильный VAE, повреждённый кэш или неполная загрузка. Быстрая попытка: повторно проверьте хэши, очистите кэш модели, подтвердите совместимость VAE.

Симптом: ошибки узла о форме или NoneType Вероятная причина: узел не выдал результат (более ранний сбой), или несовместимые версии узла/модели. Быстрая попытка: изолируйте ветвь с ошибкой, выполните рабочий процесс только до этого узла, проверьте консоль ComfyUI на предмет первой реальной строки ошибки. Если одно из этого совпало, я остаюсь на месте. Одно изменение за раз. Затем я повторяю клип на 2–3 секунды, чтобы не тратить время на длительные рендеры.

Исправление OOM: порядок понижения разрешения / точности / пакета

Мой рутинный процесс LTX-2 OOM скучный, но работает. Я делаю это в этом порядке и перехожу к следующему шагу только если OOM сохраняется:

1. Сначала разрешение

  • Снизьте высоту/ширину на 20–30%, а не вдвое. Многие графики LTX-2 чувствительны к stride (кратные 8 или 16). Я держу размеры кратными 16, чтобы избежать скрытого заполнения.
  • Если вы стремитесь к 1024×576, попробуйте 896×504. Честно говоря, это выглядит ближе к оригиналу, чем вы ожидаете.

2. Затем точность

  • Переключите точность модели на fp16 (или bf16, если ваша система это поддерживает) в соответствующем узле загрузчика. На потребительских графических процессорах NVIDIA fp16 обычно даёт самую чистую экономию памяти.
  • Смешанная точность в порядке, но я избегаю переключения между узлами во время работы. Придерживайтесь одной точности для тяжелых частей.

3. Размер пакета в последнюю очередь

  • Установите batch на 1 для выборки видео. Даже небольшие пакеты умножают ключевые активации в памяти. Я только увеличиваю batch для быстрого латента или предпросмотров.

Я также заметил тонкую победу: зафиксируйте seed во время настройки OOM. Случайность может скрыть, помогло ли вам последнее изменение.

Чёрный экран: проблемы с загрузкой модели или декодированием

Мой первый чёрный экран на этой неделе оказался не сбоем модели вообще. Это была особенность декодирования.

Как я быстро их разделяю

Проверьте размер файла и длительность

  • Если видео нужной длины и примерно ожидаемого размера, кадры могут быть там. Вашему плееру может не нравиться формат пикселей или цветовое пространство.

  • Повторно кодируйте с безопасной базовой линией: ffmpeg -i input.mp4 -pix_fmt yuv420p -c:v libx264 -crf 18 output.mp4 (см. документацию FFmpeg для получения дополнительных параметров кодирования) Проверьте консоль ComfyUI

  • Настоящие проблемы загрузки модели объявляют себя: отсутствующие веса, несовместимые ключи или несовпадение хэша VAE/модели.

  • Если вы видите успешные журналы выборки и нет исключений, вероятно, это путь отображения/кодирования.

Несовпадения размеров латента

  • Конвейеры LTX-2 ожидают определённые stride (часто кратные 16). Если ваши входные данные латента или управления не совпадают, вы можете получить пустые или почти чёрные кадры.
  • Я проверяю, что все узлы изменения размера происходят до того, как модель их ожидает, и что все ветви согласны с шириной/высотой.

Сюрпризы с диапазоном цветов

  • Полный или ограниченный диапазон может выглядеть раздавленным в чёрный цвет в некоторых плеерах. Быстрое повторное кодирование (выше) обычно всё исправляет.

Если это проблема загрузки модели, я обращаюсь к источнику: проверьте, что путь контрольной точки LTX-2 в узле загрузчика указывает на реальный файл, подтвердите контрольную сумму и убедитесь, что ожидаемый формат весов узла (safetensors vs ckpt) соответствует файлу. Официальная документация ComfyUI и README модели — единственные страницы, которым я доверяю для заметок о версии/формате.

Исправление мерцания: параметры стабильности и якорение подсказки

Мерцание не всегда ошибка. Иногда модель делает ровно то, что ей сказали, с слишком большой свободой.

Что меня успокоило:

  • Зафиксируйте seed Я блокирую seed для любого теста A/B. Это убирает одну скользкую переменную сразу.

  • Понизьте CFG на один уровень Если я на 8–9, я пробую 6. Слишком высокое руководство может тянуть кадры в разные стороны.

  • Denoise и сила движения Мягкое снижение здесь (10–20%) часто помогает больше, чем увеличение шагов. Я заметил, что немного меньше denoise лучше сохраняет временные сигналы.

  • Якорение подсказки Держите стабильный базовый prompt и перемещайте изменения в небольшой, явный раздел (ключевые кадры или краткую скобку). Изменение всего предложения между кадрами приглашает дрейф.

  • Проход временной консистентности Если ваш график имеет узел временной/консистентности, запустите его легко. Он не будет создавать деталь, но может сгладить дрожание.

  • Выбор сэмплера Я тестирую 2–3 сэмплера с одним и тем же seed. Некоторые более прыгучие на видео. Если один успокаивает рёбра при том же количестве шагов, я его использую.

Небольшое примечание: я перестала преследовать “идеальную” когерентность кадра. Для меня цель — меньше умственной усталости при редактировании, что-то, что я могу вырезать, а не совершенство под микроскопом.

Повреждённый результат: несовпадение весов / ошибки пути

Повреждение появлялось для меня как розовые блоки, блестящий снег или цветовые полосы, которые не совпадали с подсказкой. Каждый раз это было что-то банальное:

  • Несовпадающие веса Загрузчик ожидал определённый вариант LTX-2: у меня был другой с похожим названием. Теперь я включаю дату модели или хэш в имена файлов.

  • Неправильный VAE Беспечальное переключение VAE меня укусило. Исправление было простым: используйте VAE, указанный в документации узла LTX-2 или в README модели. Если ничего не указано, используйте по умолчанию встроенный или рекомендуемый автором графика.

  • Неполные загрузки Контрольная точка 3–8 ГБ, завершившаяся на 95%, выглядит полной в представлении папки. Я проверяю размер файла по сравнению с листингом репозитория и, если доступно, проверяю хэш.

  • Проблемы с путями (особенно в Windows) Символы, не входящие в ASCII, и очень длинные пути ломали мне загрузку в прошлом. Поверьте мне, я держу пути к моделям короткими (например, D:\models\ltx2\…) и избегаю пробелов, когда могу.

  • Смешанные форматы safetensors vs .ckpt не всегда взаимозаменяемы в некоторых узлах. Я совпадаю с ожиданиями узла.

Когда я подозреваю повреждение, я повторяю известный хороший крошечный prompt при крошечном разрешении. Если это чистый, я знаю, что проблема в моей текущей комбинации, а не во всей установке.

Чтение логов: какой слой рухнул

Большая часть моих ускорений пришла от чтения первой строки сбоя, а не последней драматической. Консоль ComfyUI обычно говорит вам достаточно, если вы потратите тридцать секунд.

На что я смотрю:

  • CUDA нет памяти Не ошибка. Снизьте разрешение/точность/batch как выше. Если это происходит на одном и том же шаге каждый раз, вы попадаете на пик активации, снижайте шаги или включайте внимание с экономией памяти.

  • CUDNN_STATUS_EXECUTION_FAILED или незаконный доступ в память Часто несовпадение драйвера или библиотеки. Я записываю мои версии CUDA, PyTorch и драйвера GPU в текстовый файл. Если я недавно обновил что-то, я откатываюсь или перестраиваю venv. Документация ComfyUI содержит небольшую матрицу известных хороших комбинаций.

  • несовпадение размера / ошибки формы Тензор неправильной формы. Обычно это проблема графика узла: изменение размера происходит на одной ветви и не на другой, или управляющий вход ожидает другой масштаб. Я отслеживаю размеры, где они расходятся.

  • KeyError / отсутствующие ключи state_dict Несовпадение веса-узла. Сравните перечисленные отсутствующие ключи с README модели. Неправильный вариант контрольной точки или устаревший узел.

  • AttributeError: ‘NoneType’ … Более ранний узел вернул ничего. Я запускаю график только до этого узла. Первый None — настоящий виновник.

Две привычки, которые помогли:

  • Запускайте короткие клипы во время отладки. Десять секунд журналов ошибок впустую тратят гораздо меньше времени, чем минута молчания.
  • Включите любой доступный отладочный/подробный переключатель на подозреваемом узле. Дополнительный контекст лучше угадывания.

Я держу небольшую “карту окружения” в папке проекта: модель GPU и VRAM, драйвер, CUDA, PyTorch, коммит ComfyUI, версии наборов узлов и хэш контрольной точки LTX-2. Когда что-то ломается, я сравниваю это с карточкой прошлой недели, прежде чем обвинять модель.

Когда перейти на облако (ярлык устранения неполадок WaveSpeed)

Я не спешу в облако с LTX-2, но есть моменты, когда это самый чистый способ отделить “настроение моей машины” от реальных проблем.

Когда я переходу

  • VRAM менее 16 ГБ и мне нужны выходные данные 1024p без серьёзных компромиссов.
  • Я вижу нестабильные сбои, связанные с моими локальными версиями CUDA/драйвера, и у меня нет времени перестраивать.
  • Я хочу второе мнение: один и тот же график, другое оборудование.

Что я делаю на WaveSpeed (или любой сравнимой рабочей области GPU)

  • Выберите известный хороший образ (задокументированная комбинация CUDA/PyTorch). Это имеет большее значение, чем необработанный TFLOPS, когда вы отлаживаете.
  • Синхронизируйте только минимальный график, точные веса LTX-2 (с хэшем) и одну краткую тестовую подсказку.
  • Сначала запустите крошечный воспроизводимый случай. Если это работает в облаке, а не локально, это, вероятно, окружение: если это не удаётся в обоих случаях, это график или веса.

Затраты и компромиссы

  • Да, вы будете платить за вычисления. Но одно чистое воспроизведение может сэкономить целый день рулетки с драйверами.
  • Облачные диски также могут скрывать проблемы с путями, просто по-другому. Я всё ещё держу пути короткими и ASCII.

Это не призыв переместить ваш рабочий процесс. Это просто тихий ярлык, когда вы застряли и срок громче вашего терпения.

Мы построили WaveSpeed для моментов именно таких — когда вам просто нужна чистая среда GPU, чтобы быстро исключить вещи. Если вы застряли при отладке LTX-2, вы можете попробовать наш WaveSpeed здесь.


Какая самая сумасшедшая ошибка LTX-2 вам встречалась на этой неделе? Оставьте комментарий и дайте мне знать, если это новая ловушка.