LTX 2.3 GGUF: Локальный рабочий процесс аудио и видео

Мне присылают одно и то же личное сообщение дважды в неделю: «Где скачать LTX 2.3 GGUF?» Люди ищут, находят две страницы сообщества на Hugging Face, а затем останавливаются — ни одна из них не принадлежит Lightricks. Это правильное замешательство. Обе страницы реальны, сообщество их активно поддерживает, но поддержка, лицензирование и частота обновлений не соответствуют официальному релизу.

LTX 2.3 GGUF — это набор квантизаций от сообщества для аудио-видео модели LTX-2.3 от Lightricks. Исходные веса открыты, но в полной точности. Версии GGUF переупакованы для локального инференса с меньшим потреблением VRAM. В этой статье описано, откуда берутся файлы, как запускать их в ComfyUI или через локальный лаунчер, и в какой момент я перестал бы полагаться на локальный инференс и переключился бы на размещённое выполнение.

Откуда берётся LTX 2.3 GGUF

В начале 2026 года ландшафт квантизаций от сообщества сузился до двух основных мейнтейнеров. Оба публикуют на одной платформе, оба следуют одному апстриму — чекпоинтам LTX-2.3 от Lightricks, — но подходят к задаче немного по-разному.

Квантизация от сообщества: QuantStack и Unsloth

Страница QuantStack LTX-2.3-GGUF на Hugging Face — это прямое преобразование исходных весов. В ней представлены варианты от Q2_K до Q8_0 для дистиллированной и полной версий 22B. Просто и понятно. Если вам нужен наименьший жизнеспособный файл, вам сюда.

Страница Unsloth LTX-2.3-GGUF использует то, что они называют методологией Dynamic 2.0 — важные слои сохраняются в более высокой точности, остальные агрессивно квантизируются. Репозиторий содержит как dev-, так и дистиллированные наборы, а также собственные примеры рабочих процессов. Карточка модели ссылается на инструментарий ComfyUI-GGUF от city96, который вам понадобится в любом случае.

Я не проводил достаточно длительное сравнение, чтобы публиковать цифры о том, какой вариант даёт лучшие результаты при заданном уровне квантизации. Это отдельный проект.

Официальные веса Lightricks vs. сборки GGUF от сообщества

Lightricks публикует оригинальные веса LTX-2.3 в полной точности (safetensors), официальные пайплайны инференса и официальные узлы ComfyUI (пакет ComfyUI-LTXVideo, отдельный от GGUF). Они также публикуют расширения для управления камерой, например LTX Director, которые зависят от оригинального формата весов. Эти функции либо не работают, либо работают некорректно со сборками GGUF. Это реальная потеря, в зависимости от того, что вы делаете.

Версии GGUF обменивают полное соответствие функциям апстрима на возможность работы с меньшим объёмом VRAM. Вот и вся суть. Если вам нужны все функции, которые выпускает Lightricks, запускайте полные веса. Если ваша машина не справляется — GGUF является компромиссом.

Почему неофициальный статус релиза важен для поддержки и проверки лицензий

То, что результаты поиска не говорят чётко: QuantStack и Unsloth — это участники сообщества. Они не являются Lightricks. Если что-то сломается, вы будете создавать тикет в репозитории сообщества, а не получать поддержку от вендора. Лицензия на обеих страницах сообщества — ltx-2-community-license-agreement — те же ограничения на коммерческое использование, что применяются к оригинальным весам, распространяются и на квантизированные версии. Квантизация не снимает лицензионных ограничений.

На этом стоит остановиться. Относитесь к проверке лицензии как к реальному шагу, а не к формальности.

Пути локальной настройки для разработчиков

Существует примерно три способа запустить эти сборки GGUF локально. Они не равнозначны. Они предназначены для разной аудитории.

Доступ к моделям через Hugging Face

Файлы QuantStack и Unsloth находятся на Hugging Face. Вы можете загрузить их с помощью git lfs clone или через huggingface-cli download. Если вам нужен просто наименьший жизнеспособный файл, возьмите один из вариантов среднего диапазона — названия следуют стандартным соглашениям llama.cpp (Q3_K_M, Q4_K_S, Q4_K_M и т.д.). Выберите один, скачайте и двигайтесь дальше.

Что платформа вам не даст — это среда выполнения. Только файлы.

ComfyUI + узел ComfyUI-GGUF от city96

Именно по этому пути большинство людей и приходит. Пакет узлов из репозитория ComfyUI-GGUF от city96 расширяет ComfyUI для загрузки GGUF UNet-моделей. Установите его в ComfyUI/custom_nodes, поместите GGUF-файл в ComfyUI/models/unet, перезапустите ComfyUI, и загрузчик GGUF Unet появится в категории bootleg. Далее вы подключаете его к рабочему процессу генерации видео так же, как подключали бы обычный UNet.

Важно отметить: узел city96 был написан до появления LTX-2. Он обрабатывает загрузку GGUF в общем виде. Работоспособность конкретного файла LTX-2.3 GGUF от начала до конца зависит от рабочего процесса и от файлов текстового энкодера и VAE, которые ожидаются рядом с основной моделью. Именно поэтому обе страницы сообщества публикуют примеры рабочих процессов — начните с них.

Pinokio или локальный лаунчер как запасной путь

Открытый лаунчер Pinokio упаковывает AI-приложения с установкой в один клик, управляя средами Python, зависимостями и загрузками моделей через графический интерфейс. Это не замена ComfyUI. Это способ пропустить ручную настройку, если в его каталоге уже существует скрипт для нужного вам приложения.

Для этих квантизированных моделей ценность Pinokio зависит от того, существует ли поддерживаемый скрипт, нацеленный на текущий релиз. Проверьте заранее. Если вы уже работаете в ComfyUI, лаунчер мало что добавляет. Если вы начинаете с нуля на Windows-машине без настройки Python, он избавит вас от многих часов мучений.

Как оценивать варианты GGUF

Выбор уровня квантизации — это не просто «меньше = ниже качество». Компромиссы нелинейны и различаются в зависимости от модели.

Варианты квантизации, такие как Q4KM и аналогичные

Q4_K_M — распространённая отправная точка, поскольку он находится в середине стандартного диапазона llama.cpp — достаточно мал, чтобы поместиться на потребительские GPU, достаточно велик, чтобы сохранить большую часть исходного поведения. Варианты Q3 позволяют работать с меньшим объёмом VRAM, но деградация качества становится заметной в мелких деталях. Q8 сохраняет больше от оригинала, но файл становится настолько большим, что смысл запуска GGUF локально частично теряется.

Я начинаю с Q4_K_M при первых запусках. Если результаты выглядят приемлемо — остаюсь. Если нет — сначала пробую более высокий уровень, а не более низкий.

Логирование промптов, сидов и результатов

Тестовые запуски без контроля сида — это не тесты. Это гадание. Зафиксируйте сид, запишите промпт в файл, сохраните имя выходного файла вместе с обоими. Когда вы будете менять уровни квантизации или рабочие процессы, вы захотите сравнивать подобное с подобным, а «мне кажется, версия Q4 выглядела хуже» не поможет, если вы не можете воспроизвести сравнение.

Я веду простую CSV: промпт, сид, уровень квантизации, файл рабочего процесса, путь к выходному файлу, однострочная оценка. Скучно. Эффективно.

Проверка синхронизации аудио и видео

LTX-2 генерирует синхронизированное аудио и видео в одной модели — это главная функция. Именно синхронизация, скорее всего, незаметно деградирует при квантизации GGUF, поскольку квантизация затрагивает все слои, включая те, что отвечают за аудиовизуальное выравнивание. Просматривайте результаты полностью, а не только первые 1-2 секунды. Движение губ, отстающее от звуковой дорожки на долю секунды, — это наиболее часто встречаемый мной сбой.

На этом мои данные заканчиваются. Я не проводил контролируемых измерений дрейфа и с осторожностью отнёсся бы к любым публикуемым данным без указания методологии.

Не делайте жёстких заявлений о железе без контекста тестирования

Вы увидите темы на Reddit с утверждениями вроде «Q4_K_M работает со скоростью X токен/сек на 3090» или «12 ГБ VRAM достаточно». Не воспринимайте это как универсальные данные. Это единственная точка данных на одном рабочем процессе с неуказанными размерами батча, разрешениями и количеством кадров. Тестируйте на своём железе, с вашим рабочим процессом, и записывайте то, что измерили.

Производственные компромиссы локального инференса

Запуск этих моделей локально вполне подходит для экспериментов. Вопрос в том, масштабируется ли это до продакшна. Ответ: иногда.

Локальный контроль и конфиденциальность

Аргументы в пользу локального запуска весомы. Промпты остаются на вашей машине. Результаты остаются на вашей машине. Никакой телеметрии использования, никаких ограничений скорости, никаких неожиданных ежемесячных счетов. Для рабочих процессов с конфиденциальными материалами клиентов или IP-информацией до публичного релиза это немаловажно.

Риски обслуживания, драйверов и зависимостей

Аргументы против локального запуска тоже весомы, и они проявляются позже. Обновления ComfyUI могут нарушить совместимость с пользовательскими узлами. Обновления драйверов CUDA могут сломать PyTorch. Обновление Windows может изменить пути к файлам. Локальный стек, который работал во вторник, может не работать в пятницу. Это не проблема качества программного обеспечения — это цена запуска стека исследовательского уровня вне управляемой среды.

Для индивидуальной работы это раздражает. Для командного продакшна это превращается в работу на неполную ставку, о которой никто не просил.

Когда размещённый инференс безопаснее

Существует порог использования, выше которого запуск LTX-2.3 — квантизированного или нет — на собственном железе перестаёт иметь смысл. Признаки: вы генерируете несколько видео в день, вам нужен согласованный вывод для членов команды на разных машинах, или вам нужна пропускная способность, не зависящая от того, сломало ли вчерашнее обновление драйвера ComfyUI. При таких условиях размещённый инференс — где кто-то другой управляет GPU, файлами моделей и стеком зависимостей — обычно выигрывает.

У размещённого варианта свои компромиссы: данные покидают вашу машину, стоимость за генерацию измеряется, выбор модели ограничен тем, что поддерживает провайдер. Но затраты на обслуживание сводятся к нулю, что для производственных команд обычно является правильным выбором.

Смежные поисковые запросы GGUF, с которыми следует быть осторожным

Если вы искали LTX 2.3 GGUF, вы, вероятно, также видели в тех же результатах Sulphur 2 GGUF. Это разные вещи.

Почему Sulphur 2 GGUF — это, скорее всего, отдельный запрос

Sulphur 2 GGUF — это файнтюн LTX-2.3 от сообщества, распространяемый через Civitai, а не через упомянутых выше мейнтейнеров, нацеленный на NSFW-контент с собственной зависимостью от пользовательских узлов (smthemex/ComfyUI_LTX2_SM, а не пакет от city96). Другая модель, другой рабочий процесс, другая аудитория. Если вы попали сюда в поисках этого, вы не в той статье.

Когда стоит разбить сравнение GGUF на отдельную статью

Sulphur 2 GGUF я бы описал отдельно. Аудитория, проверка лицензии и настройка среды выполнения достаточно различны, чтобы смешивание сравнения обеднило обе статьи. Требует проверки — я лично не тестировал его, и любой будущий обзор начинался бы с этого раскрытия.

Часто задаваемые вопросы

Является ли LTX 2.3 GGUF официальным релизом Lightricks?

Нет. Этот термин относится к квантизациям, поддерживаемым сообществом и опубликованным QuantStack и Unsloth на Hugging Face. Это прямые преобразования исходных весов LTX-2.3 от Lightricks, но сама Lightricks публикует только чекпоинты в полной точности. Пожалуйста, обратитесь к официальной документации Lightricks для получения актуальной информации о прямом релизе GGUF.

Как запустить LTX 2.3 GGUF в ComfyUI?

Установите узел ComfyUI-GGUF от city96 в ComfyUI/custom_nodes, поместите GGUF-файл в ComfyUI/models/unet, перезапустите ComfyUI и используйте загрузчик GGUF Unet в категории bootleg. Вам также понадобятся соответствующие файлы текстового энкодера и VAE, указанные в том рабочем процессе сообщества, которому вы следуете. Страницы Unsloth и QuantStack обе содержат примеры рабочих процессов, которые стоит взять за основу.

Каковы риски использования квантизированных моделей от сообщества?

Три основных. Отсутствие поддержки вендора при возникновении проблем — вы будете работать с трекерами задач сообщества. Проверка лицензии остаётся вашей ответственностью: лицензия сообщества LTX-2 по-прежнему применяется, и официальные условия лицензии опубликованы в репозитории LTX-2 от Lightricks. И пробелы в функциональности по сравнению с официальными весами — расширения вроде LTX Director или новые официальные обновления пайплайна могут некорректно работать со сборками GGUF. Пожалуйста, обратитесь к актуальной документации Lightricks для получения информации о текущем состоянии официального соответствия функций.

Что использовать: Pinokio, Hugging Face, ComfyUI или размещённый инференс?

Зависит от того, что вы делаете. Pinokio — для пропуска настройки, если скрипт для вашего целевого приложения существует. Hugging Face — для прямой загрузки файлов. ComfyUI с узлом GGUF от city96 — для фактического запуска и настройки рабочих процессов. Размещённый инференс — когда затраты на локальное обслуживание превышают ценность выполнения на собственной машине. Граница обычно определяется тем, передаёте ли вы результаты кому-то кроме себя.

Предыдущие публикации: