NVFP4 vs NVFP8 для LTX-2: сравнение скорости, качества и использования VRAM (руководство RTX)

Я не искал параметры точности. Я столкнулся с ними, потому что LTX-2 постоянно подводил мой GPU на 16 ГБ к пределу во время пакетного рендера. Предпросмотр зависал, вентилятор гудел, и этот маленький выпадающий список, NVFP4 или NVFP8, внезапно казался не нишевым вариантом, а способом пережить день.

На прошлой неделе (январь 2026 г.) я тестировал LTX-2 с NVFP4 и NVFP8 в нескольких скучных, однообразных сценариях: короткие клипы в 1080p и 2K для концепт-проходов, и пару стилей и панорам в 4K для мудбордов клиентов. Ничего героического, знаете. Просто работа, которая накапливается. Вот что я заметил, что работало, и где каждый параметр помог, или, наоборот, мешал.

NVFP4 против NVFP8 в одном предложении

NVFP4 жертвует немного качеством и стабильностью ради меньшего объема VRAM и более быстрой пропускной способности: NVFP8 лучше сохраняет детали, но требует больше от вашего GPU.

Матрица компромиссов скорости / VRAM / качества

Я это упростю, потому что реальность простая.

Скорость: NVFP4 обычно был на 15–30% быстрее в моих тестах, в зависимости от разрешения и размера пакета: NVFP8 замедлялся немного, но оставался стабильным.
VRAM: NVFP4 сократил потребление памяти примерно на 25–40%: NVFP8 использовал больше, но снижал артефакты.
Качество: NVFP8 лучше сохранял острые края (волосы, вывески, микротекстуры) и снижал мерцание при движении: NVFP4 смягчал детали и иногда добавлял небольшое временное дрожание.

Вот суть. Остальное зависит от ситуации.

Несколько полевых заметок из повторяемых тестов на RTX 4090 (24 ГБ) и 4080 (16 ГБ):

1080p, короткие клипы (4–6с): NVFP4 держал предпросмотр гладким и позволял увеличивать размеры пакетов: NVFP8 держал лица и текст чище от кадра к кадру.
2K, средние клипы (8–12с): NVFP4 был хорош для первых проходов: NVFP8 избегал крошечного «ползания» текстур при панорамировании.
4K, статические изображения: NVFP8 того стоил. Я бы лучше подождал, чем потратил время на ретушь краев.

Ничего из этого не было драматичным. Но я это чувствовал. Меньше давления на VRAM с NVFP4 означало меньше перебоев. Чище выход с NVFP8 означало меньше переделок.

Когда использовать NVFP4 (пакетное производство / низкий VRAM)

Я выбираю NVFP4, когда мне важнее процесс, чем результат.

Где NVFP4 помогал

Концепт-проходы пакетом: я мог запускать 3–6 промптов параллельно в 1080p на 16 ГБ без борьбы с памятью. Это означало, что я оставался в потоке и сравнивал варианты быстрее.
Грубые монтажи и раскадровки: для быстрых бордов с временными кадрами небольшая мягкость не имела значения. Это даже скрывало странности.
Длительные сеансы: место в VRAM означало меньше перезагрузок. Меньше трения накапливается за день.

Компромиссы, которые я действительно заметил

Потеря микродеталей: тонкие узоры (сетка, линия волос, маленькие отражения) немного приглушались. Не сломлены, просто менее четкие.
Временная стабильность: при медленной панораме NVFP4 иногда вводил крошечное мерцание в областях с высокой частотой. Это не всегда было очевидно на временной шкале, но проявлялось при паузе.

Практические диапазоны, которые казались безопасными

1080p, короткие клипы: NVFP4 с скромными размерами пакетов (2–4) комфортно укладывался в 16 ГБ.
2K, короткие клипы: NVFP4 держал все гладким на 16 ГБ, если я не прижимал длину контекста слишком высоко.

Почему его использовать: NVFP4 — это хорошая «думающая точность». Это снижает стоимость исследования идей. Если выход только для вас или проверки в команде, NVFP4 делает LTX-2 легким.

Когда использовать NVFP8 (качество / тонкие детали)

Я переключаюсь на NVFP8, когда закрываю цикл.

Где NVFP8 был того стоит

Финальные кадры для презентаций: если кадр может путешествовать, делиться с клиентом, портфолио или соцсети, NVFP8 снижал объем уборки.
Лица и руки: края держались лучше, и маленькое подергивание вокруг ресниц/линии волос успокаивалось.
Текст и вывески: не идеально, но чаще разборчиво. Меньше переренднеров только чтобы исправить дрожащую букву.

Затраты, которые нужно принять

Тяжелее по VRAM: на 16 ГБ я держал размеры пакетов низкими на 2K и избегал накладывания дополнительных узлов в одном графе.
Медленнее на немного: мне не возражал против ожидания, потому что я запускал NVFP8 только после того, как мне понравился кадр.

Если вы касаетесь 4K даже для статических изображений, NVFP8 — это более безопасный выбор по умолчанию. Я один раз попытался сэкономить время с NVFP4 при 4K: я потратил это время на постобработку для чистки краев.

Таблица конфигурации по разрешению (1080p / 2K / 4K)

Это не правила. Это то, что держало меня в движении без постоянной суеты. Железо важно. Это было на:

RTX 4080 16 ГБ (рабочий стол)
RTX 4090 24 ГБ (студийная машина)

Определения:

«Пакет» здесь = параллельные промпты или клипы в одном запуске графа.
«Контекст/длина» = как долго работает ваша последовательность или сколько кондиционирования вы добавляете.

1080p (1920×1080)

16 ГБ: NVFP4, пакет 3–4, короткие клипы (≤6с) кажутся безопасными: NVFP8, пакет 2, стабильно.
24 ГБ: NVFP4, пакет 6–8 легко: NVFP8, пакет 3–4 с местом для дополнительных.

2K (2048×1152 или 2048×1536)

16 ГБ: NVFP4, пакет 2–3: NVFP8, пакет 1–2: держите контекст умеренным.
24 ГБ: NVFP4, пакет 4: NVFP8, пакет 2–3, смотрите на накладывание узлов.

4K (3840×2160)

16 ГБ: NVFP4, только синглы, короткие контексты: NVFP8, синглы, будьте терпеливы.
24 ГБ: NVFP4, пакет 2 в скромном графе: NVFP8, синглы или пакет 2, если другие узлы легкие.

Признаки, что вы переусложняете:

Всплески VRAM при скроллинге или изменении сидов во время запуска.
Выход начинается хорошо, но деградирует в более поздних кадрах.
Предпросмотр ComfyUI делает более длительные паузы между кадрами, чем обычно.

Если вы столкнулись с любым из них, сначала сократите размер пакета. Затем сократите последовательность. Точность обычно последний рычаг, который я использую.

Как переключать точность в ComfyUI

Это немного зависит от набора узлов, который вы используете, но вот что я видел (январь 2026 г.):

Загрузчик модели или узел LTX-2: обычно там есть выпадающий список Precision или Dtype. Я видел варианты типа NVFP4, NVFP8 и float16. Я переключаю это там и оставляю остальной график без изменений.
Если нет выпадающего списка: проверьте документы узла или readme репозитория. Некоторые сборки наследуют параметр из глобальной конфигурации или флага окружения.
Смешанные графы: если вы объединяете LTX-2 с увеличителями или постузлами, следите за несовпадениями dtype. Большинство узлов приводят автоматически, но иногда вы платите скрытый налог на память.

Что работало для меня

Сохраняйте две версии одного и того же графа: одну назовите _fp4 для исследования, одну _fp8 для финалов. Таким образом, я не охотнюсь за переключателем.
Держите предпросмотр включенным на проходах NVFP4. Если предпросмотр заикается, это обычно признак того, что мой пакет или контекст слишком высоки даже для fp4.

Если вам нужны конкретики, официальные документы или репозиторий узла часто объясняют, как передается флаг точности. Я их перепроверяю, когда что-то кажется не так.

Протестируйте оба на WaveSpeed

Я не доверял только своему взгляду, поэтому я полагался на простой цикл: одинаковый промпт, одинаковый сид, два запуска, один в NVFP4, один в NVFP8, время с маленьким рабочим процессом WaveSpeed и секундомером сбоку. Мне важнее форма разницы, чем точные числа.

Что я измерял (приблизительно)

Пропускная способность: NVFP4 постоянно завершался на 15–30% быстрее на моем ящике с 16 ГБ: ближе к 20% на ящике с 24 ГБ.
Место в VRAM: NVFP4 оставлял мне 2–4 ГБ дополнительных на 1080p, что позволяло держать легкий узел denoise активным. NVFP8 ел эту маржу.
Визуалы: при медленной панораме по кирпичам и листве NVFP8 сохранял текстуру. NVFP4 немного размывал и добавлял крошечное мерцание. На клипах с активным движением я едва замечал.

WaveSpeed (или любой другой тестовый стенд) помогает мне быть честным. Я запускаю три пары и отбрасываю первую как разминку. Затем я задаю скучный вопрос: этот параметр сэкономил мне шаги? Если ответ «да», то он закрепляется.

Если вы хотите сравнить NVFP4 и NVFP8 без борьбы с локальными ограничениями VRAM, WaveSpeed позволяет вам запускать одинаковые промпты LTX-2 и сиды на больших облачных GPU. Это простой способ проверить скорость, место в памяти и визуальные компромиссы перед тем, как вы зафиксируете параметры. Кто может предпочесть что-то:

Если вы раскадровываете, прототипируете функции или производите концепты в социальных сетях в больших объемах, NVFP4 хорошо сочетается со сроками.
Если вы передаете кадры, которые будут остановлены, увеличены или готовы к печати, NVFP8 оправдывает себя.

Я не буду утверждать, что один лучше. Это разные передачи. Я переключаюсь намного реже теперь, когда я назвал, когда каждый помогает.

Маленькая заметка, которую я держу в углу своей записной книжки: когда рендер кажется «шумным» для оценки, это обычно не проблема точности, это проблема распространения параметров. Я сначала сокращаю переменные, потом переключаю NVFP4/NVFP8.

Вот где я это оставлю. Вчера NVFP8 сэкономил мне час, который я потратил на очистку краев на статике 4K. Этим утром NVFP4 позволил мне просмотреть четыре варианта одновременно, не звучав как взлет. Мне больше ничего не нужно.