Что такое Z-Image-Base? Полный контроль CFG против турбо-скорости

Что такое Z-Image-Base? Полный контроль CFG против турбо-скорости

Привет, я Дора. Недавно меня беспокоит одна маленькая проблема. Я хотела, чтобы мои баннерные графики перестали выглядеть немного… странно. Цвета смещались. Лица казались неживыми. И когда я пыталась исправить одно, что-то другое сдвигалось. Последняя капля терпения была вот в чём: я не могла немного подкорректировать результат, не нарушив баланс всего изображения.

Поэтому на прошлой неделе и снова в понедельник утром (февраль 2026) я попробовала Z-Image-Base вместе с его более быстрым братом Z-Image-Turbo. Я не гналась за скоростью. Я хотела более стабильный контроль, подсказки, которые работают так, как нужно, правки, которые остаются, и меньше головоломок между запусками.

Что такое Z-Image-Base?

Z-Image-Base — это модель генерации изображений с 6 млрд параметров, которая ориентирована на контроль и предсказуемость, а не на чистую скорость. Если Turbo — это спринт, то Base — это спокойная прогулка с картой. Она предоставляет больше рычагов управления, которые действительно важны, когда вы пытаетесь совместить с эталоном, сохранить цвета бренда или отработать один визуальный концепт без потери нити.

Архитектура с 6 млрд параметров

Я здесь не для того, чтобы преклоняться перед количеством параметров, но отметка в 6 млрд говорит о простом: достаточно мощности, чтобы сохранить стиль и структуру без коллапса при небольших изменениях. На практике я заметила две вещи, когда тестировала 2–3 февраля 2026:

  • Правки складывались чище. Изменение цветовой температуры или освещения не стирало композицию так часто.
  • Значения seed вели себя более предсказуемо между запусками. Когда я зафиксировала seed и отрегулировала силу guidance, сцена развивалась, а не сбрасывалась.

Под капотом это всё ещё диффузионный процесс: масштабы guidance, расписание шума и обычный танец шагов и seeds. Если вас интересует теория, здесь вступает в игру classifier-free guidance. Но для меня было важно вот что: мои небольшие изменения подсказок ощущались пропорциональны выводу.

Ключевые отличия от Z-Image-Turbo

Turbo дешевле и быстрее. Отлично подходит для быстрого исследования концепций, миниатюр, мудбордов, социальных черновиков. Но я постоянно сталкивалась с одной и той же стеной: как только мне что-то нравилось, получить точную вариацию (более тёплый тон, мягче тени, чуть более плотный кроп) требовало больше времени, чем должно было.

Base дал мне более точный контроль. Отрицательные подсказки лучше придерживались, эталонные изображения сильнее влияли, когда я просила об этом, и регулировки CFG ощущались линейными, а не резкими. Запуски были медленнее и дороже за изображение, да, но меньше переделок компенсировало это на любой задаче, где точность имела значение.

Основные возможности Z-Image-Base

Это не точечные функции для запоминания. Это рычаги, которые я находила себе в руках, и что изменялось, когда я их использовала.

Полная поддержка CFG

С Base​ guidance вёл себя как регулятор, а не как переключатель. Низкий CFG позволял модели исследовать, полезно, когда подсказка казалась слишком жёсткой. Высокий CFG приближал изображения к тексту, но без хрупкого, переконтрастированного вида, который я иногда вижу у меньших или переусложненных моделей.

В реальном проходе: я генерировала серию заголовков статей («спокойное рабочее пространство, приглушённая палитра, естественный свет, минимум беспорядка»). При CFG 4–5 я получала мягкие, атмосферные результаты, хорошие, но неопределённые. При 7–8 композиция закреплялась: стол, оконный свет, чистые линии. Выше 10 детали начинали чрезмерно соответствовать (жёсткие края, менее органичный свет). Мой оптимальный диапазон составил около 7,5 для этого стиля.

Контроль отрицательных подсказок

Здесь Base завоевала мою уверенность. Когда я просила «без бликов, без глянцевых отражений, без наклонённых углов», модель действительно отступала. С Turbo эти примечания иногда игнорировались, если основная подсказка была кинематографичной.

Небольшой пример: для макета предметного снимка «без зеркальных бликов» плюс «матовая поверхность» давал последовательные поверхности в 6 из 8 запусков. Не идеально, но достаточно последовательно, чтобы я не переделывала вручную каждый рендер. Умственная нагрузка упала, меньше микрокорректировок.

Управление эталонным изображением

Я использовала два эталона: карточку цветов бренда и макет из прошлого дизайна. Base лучше уважал обоих, когда я установил более высокий вес эталона. Цвета держались в диапазоне, соответствующем палитре (не точно, но достаточно близко, чтобы я не переписывала каждый рендер), а композиция оставалась внутри кадра без ощущения жёсткости.

Есть компромисс. Сильно увеличьте вес эталона, и вы получите безжизненное отражение источника. Держите его умеренным, и вы получите непрерывность без клонирования. Для меня 0,35–0,55 ощущались правильно, когда мне нужна была согласованность бренда: 0,15–0,25, когда я просто хотела лёгкий толчок.

Настройка параметра Strength

Называйте это силой шума, силой image-to-image или просто «насколько много мы должны изменить это?», рычаг важен. С Base средние правки (около 0,45–0,6 в моих запусках) сохраняли макет, позволяя стилю развиваться. Это идеально для «та же сцена, другое настроение».

Два запуска, которые выделились:

  • Я смягчила полуденное освещение на теплоту позднего дня, не потеряв размещение объектов. Один ход слайдера, один запуск, готово.
  • Я заменила текстурированный фон на плоский, сохраняя маску субъекта достаточно нетронутой, чтобы мне не нужно было переснимать силуэт.

Это не сэкономило мне время вначале, я возилась. Но после нескольких проходов я заметила, что это сократило переделки и снизило умственные затраты. Модель изменила то, что я просила, и оставила остальное в покое.

Когда выбирать Base вместо Turbo

Я переключалась между двумя день, чтобы почувствовать разницу. Выбор был не философским: он был практичным.

Выбирайте Base: когда точный контроль важен

  • Вы совпадаете с палитрами бренда или повторяющимися макетами, и небольшие отклонения дорогостоящи.
  • Вам нужны отрицательные подсказки, которые придерживаются (без глянцевых отражений, без экстремальной глубины резкости, без наклонённого горизонта), потому что время очистки складывается.
  • Вы отрабатываете один концепт на несколько запусков и не хотите сбрасывать композицию каждый раз, когда вы подстраиваете освещение или цвет.

Base не сделал изображения «лучше» сами по себе. Это сделало коррекции придерживаться. Это была победа.

Выбирайте Turbo: когда скорость приоритет

  • Вы исследуете направления, генерируете много вариантов или быстро создаёте раскадровку.
  • Вы нормально относитесь к грубости и планируете отполировать небольшое подмножество позже.
  • Стоимость является фактором, и вы хотите сначала охватить широкий диапазон.

Мой паттерн сейчас: начинайте в Turbo, чтобы сориентироваться в пространстве, переходите на Base, как только заметите направление, стоящее сохранения. Это двухскоростная система, которая ощущается разумной.

Сравнение цен

Цены меняются, но вот что я использовала во время тестирования в начале февраля 2026.

Base: $0,01/изображение

По пенни за изображение Base не дорого, но это не выбросить-дешево также. Если вы глубоко работаете над одним визуалом, скажем, 20–40 запусков, дополнительный контроль часто окупается в виде меньшего переделок ниже по течению (меньше ручного редактирования, меньше перезапусков).

Turbo: $0,005/изображение

Половина цены и заметно быстрее. Отлично подходит для генерирования 50–100 грубых вариантов для поиска направления. Если ваш рабочий процесс — «думайте широко, совершенствуйте узко», Turbo держит первую фазу доступной.

Быстрый старт

Если вы любопытны и хотите почувствовать разницу без чтения документов, это путь, который я бы выбрала.

  1. Выберите одну основополагающую подсказку. Что-то знакомое, вроде «мягко освещённая сцена письменного стола, приглушённые цвета, натуральное дерево, без беспорядка».
  2. Запустите 6–8 изображений в Turbo. Отметьте одно, которое вы действительно бы использовали.
  3. Переключитесь на Base с тем же seed (или близким seed). Установите CFG 7–8.
  4. Добавьте отрицательные подсказки, которые важны для вас (нет жёстких теней, нет бликов, нет наклонённого угла).
  5. Если у вас есть эталон, палитра или макет, применить его с умеренным весом (0,3–0,5).
  6. Используйте strength ~0,5 для первой вариации. Поднимайте или опускайте в небольших шагах.
  7. Сохраняйте то, что улучшает. Отменяйте то, что сопротивляется. Не гонитесь за совершенством: гонитесь за повторяемостью.

Это сработало для меня, ваш опыт может быть другим. Разница проявилась не в одном «вау» изображении, а в том, как модель реагировала, когда я просила о маленьких, скучных исправлениях. Вот где инструменты либо хорошо стареют, либо становятся громкими.

Одно последнее замечание: если вы гадаете «​Что такое Z-Image-Base​» сверх спецификаций, это вот это для меня, модель, которая позволяет маленьким решениям придерживаться. Я выберу это над фейерверками любой день.