Z-Image-Base란 무엇인가? 완전한 CFG 제어 vs 터보 속도
안녕하세요, 저는 도라입니다. 최근에 작은 문제로 인해 골치를 앓고 있었습니다. 배너 그래픽이 조금… 이상하게 나오는 것을 멈추고 싶었거든요. 색상이 변하곤 했습니다. 얼굴들은 어색하게 기울어졌습니다. 한 가지를 수정하려고 하면 다른 것이 밀려났습니다. 마지막으로 나를 짜증나게 한 사소한 문제는 이것이었습니다: 전체 이미지의 균형을 깨뜨리지 않고 결과물을 조정할 수 없었다는 것입니다.
그래서 지난주와 이번 월요일 아침(2026년 2월)에 저는 Z-Image-Base를 더 빠른 형제 모델인 Z-Image-Turbo와 함께 시도해 보았습니다. 저는 속도를 추구하지 않았습니다. 저는 더 안정적인 제어, 일관성 있게 작동하는 프롬프트, 조정이 유지되는 것, 그리고 실행 간 번거로운 과정을 줄이고 싶었습니다.
Z-Image-Base란 무엇인가요?
Z-Image-Base는 순수한 속도보다는 제어와 예측 가능성을 지향하는 6B 파라미터 이미지 생성 모델입니다. 터보가 스프린트처럼 느껴진다면, 베이스는 지도를 들고 하는 안정적인 산책처럼 느껴집니다. 참고 자료와 일치시키거나, 브랜드 색상을 일관되게 유지하거나, 흐름을 잃지 않고 하나의 시각적 개념을 반복할 때 실제로 중요한 더 많은 제어 옵션을 노출합니다.
6B 파라미터 아키텍처 개요
저는 파라미터 수를 숭배하러 여기 온 것이 아니지만, 6B 수치는 간단한 것을 시사합니다: 작은 변화로 붕괴되지 않고 스타일과 구조를 유지할 수 있는 충분한 용량입니다. 실제로, 2026년 2월 2-3일에 테스트하면서 두 가지를 주목했습니다:
- 편집이 더 깔끔하게 쌓였습니다. 색온도나 조명을 변경해도 구성이 자주 지워지지 않았습니다.
- 시드는 실행 간에 더 예측 가능하게 작동했습니다. 시드를 고정하고 가이던스 강도를 조정할 때, 장면이 리셋되지 않고 진화했습니다.
내부적으로는 여전히 확산 스타일 경험입니다: 가이던스 스케일, 노이즈 스케줄, 그리고 단계와 시드의 일반적인 춤입니다. 이론을 신경 쓴다면, 여기가 분류기 없는 가이던스가 역할을 하는 곳입니다. 하지만 제게 중요했던 것은 이것이었습니다: 작은 프롬프트 변경이 출력에 비례하게 느껴졌다는 것입니다.
Z-Image-Turbo와의 주요 차이점
터보는 저렴하고 빠릅니다. 빠른 개념 탐색, 썸네일, 무드 보드, 소셜 초안에 훌륭합니다. 하지만 저는 같은 벽에 계속 부딪혔습니다: 마음에 드는 것을 찾으면, 정확한 변형(따뜻한 톤, 부드러운 그림자, 약간 더 타이트한 자르기)을 얻는 것이 예상보다 오래 걸렸습니다.
베이스는 더 세밀한 제어를 제공했습니다. 네거티브 프롬프트가 더 잘 유지되었고, 참고 이미지가 제가 요청할 때 더 강한 영향력을 미쳤으며, CFG 조정이 점프 같은 대신 선형으로 느껴졌습니다. 실행이 더 느리고 이미지당 비용이 더 많이 들었지만, 충실도가 중요한 모든 작업에서 더 적은 재시도가 이를 보상했습니다.
Z-Image-Base의 핵심 기능
이것들은 암기할 불릿 포인트 기능이 아닙니다. 이것들은 제가 스스로 사용하게 된 레버였고, 그것을 할 때 변한 것입니다.
완전한 CFG 지원
베이스에서, 가이던스는 전등 스위치처럼이 아니라 조광기처럼 작동했습니다. 낮은 CFG는 프롬프트가 너무 딱딱하게 느껴질 때 유용한 모델의 탐색을 허용했습니다. 더 높은 CFG는 이미지를 텍스트에 더 가깝게 스냅했지만, 더 작거나 과도하게 조정된 모델에서 때때로 보는 부서지기 쉬운, 과도하게 대비된 모양 없이였습니다.
실제 작업에서: 저는 일련의 기사 헤더를 생성했습니다(“침착한 작업 공간, 음침한 팔레트, 자연광, 최소 혼란”). CFG 4-5에서, 저는 부드럽고 대기적인 결과를 얻었으며, 좋았지만, 모호했습니다. CFG 7-8에서, 구성이 고정되었습니다: 책상, 창문 빛, 깔끔한 선들. 10 이상에서, 세부 사항이 과도하게 일치하기 시작했습니다(거친 가장자리, 덜 유기적인 빛). 제 최적 지점은 이 스타일에서 약 7.5 주변에 정착했습니다.
네거티브 프롬프트 제어
여기가 베이스가 제 신뢰를 얻은 곳입니다. “렌즈 플레어 없음, 반짝한 반사 없음, 기울어진 각도 없음”을 요청했을 때, 모델은 실제로 물러섰습니다. 터보의 경우, 주요 프롬프트가 시네마틱하게 기울었다면 이러한 메모들이 때때로 무시되곤 했습니다.
작은 예: 제품 샷 목업의 경우, “반사 하이라이트 없음”과 “무광 마무리”는 8 번의 실행 중 6 번 일관된 표면을 생성했습니다. 완벽하지는 않지만, 모든 렌더를 손으로 재터치할 필요가 없을 정도로 일관성이 있었습니다. 정신적 부담이 줄어들었고, 더 적은 미세 조정이 필요했습니다.
참고 이미지 가이던스
저는 두 가지 참고 자료를 사용했습니다: 브랜드 색상 카드와 과거 디자인의 레이아웃 프레임입니다. 베이스는 참고 가중치를 더 높게 설정했을 때 둘 다 더 강하게 존중했습니다. 색상은 팔레트와 일치하는 범위 내에서 유지되었고(정확하지는 않지만, 다시 칠할 필요가 없을 정도로 충분히 가까웠음), 구성은 경직된 느낌 없이 프레임 내에 머물렀습니다.
트레이드오프가 있습니다. 참고 가중치를 너무 멀리 밀면 원본의 답답한 에코를 얻습니다. 적당한 수준에서 유지하면 복제하지 않고 연속성을 얻습니다. 제게는 브랜드 일관성이 필요할 때 0.35-0.55가 적절했고, 약간의 밀침만 원할 때는 0.15-0.25였습니다.
강도 파라미터 튜닝
디노이즈 강도, 이미지-투-이미지 강도, 또는 단지 “얼마나 많이 변경해야 할까?”라고 부르든, 이 노브는 중요합니다. 베이스에서, 중간 강도 편집(제 실행에서 약 0.45-0.6)은 스타일이 진화하도록 하면서 레이아웃을 보존했습니다. 이것은 “같은 장면, 다른 분위기”에 이상적입니다.
눈에 띄었던 두 번의 실행:
- 저는 객체 배치를 잃지 않으면서 정오의 조명을 늦은 오후의 따뜻함으로 부드럽게 했습니다. 한 번의 슬라이더 이동, 한 번의 실행, 완료.
- 저는 주체 마스크를 충분히 유지하면서 질감이 있는 배경을 평면으로 바꿨기 때문에 실루엣을 다시 촬영할 필요가 없었습니다.
이것이 처음에 시간을 절약해주지는 않았습니다. 저는 비틀거렸습니다. 하지만 몇 번의 실행 후, 재시도를 줄이고 정신적 노력을 감소시켰음을 주목했습니다. 모델은 내가 요청한 것을 변경했고 나머지는 그대로 뒀습니다.
베이스와 터보 중 언제 선택할 것인가
저는 차이를 느끼기 위해 하루 동안 둘 사이를 계속 전환했습니다. 선택은 철학적이지 않았습니다: 실질적이었습니다.
베이스 선택: 세밀한 제어가 중요할 때
- 브랜드 팔레트나 반복적인 레이아웃과 일치시키고 있으며 작은 편차가 비용이 많이 듭니다.
- 네거티브 프롬프트가 유지되어야 합니다(반짝한 반사 없음, 극단적인 피사계 심도 없음, 기울어진 수평선 없음) 정리 시간이 쌓이기 때문입니다.
- 한 개념을 여러 번에 걸쳐 반복하고 있으며 조명이나 색상을 조정할 때마다 구성을 리셋하고 싶지 않습니다.
베이스는 그 자체로 이미지를 “더 좋게” 만들지 않았습니다. 이것은 수정 사항을 유지하게 했습니다. 그것이 승리였습니다.
터보 선택: 속도가 우선순위일 때
- 방향을 탐색하고, 많은 옵션을 생성하거나, 빠르게 스토리보드를 작성하고 있습니다.
- 거칠기를 감수하고 나중에 작은 부분만 광택을 낼 계획입니다.
- 비용이 요소이며 먼저 넓은 범위를 원합니다.
제 현재 패턴: 공간을 지도하기 위해 터보에서 시작하고, 유지할 가치가 있는 방향을 발견하면 베이스로 이동합니다. 그것은 이성적으로 느껴지는 2단 시스템입니다.
가격 비교
가격은 변하지만, 여기 2026년 초 테스트 중에 제가 사용한 것입니다.
베이스: $0.01/이미지
이미지당 1센트에서, 베이스는 비싸지 않지만, 버리고 싶을 정도로 싸지도 않습니다. 한 시각을 깊게 반복하는 경우, 예를 들어 20-40번의 실행에서, 추가 제어는 종종 다운스트림에서 더 적은 재작업(수동 편집 감소, 더 적은 재시작)으로 스스로를 지불합니다.
터보: $0.005/이미지
절반 가격이고 눈에 띄게 빠릅니다. 방향을 찾기 위해 50-100 개의 대략적인 것을 생성하는 데 훌륭합니다. 당신의 워크플로우가 “넓게 구상하고, 좁게 개선”이라면, 터보는 첫 번째 단계를 저렴하게 유지합니다.
빠른 시작
호기심이 있고 문서를 읽지 않고 차이를 느끼고 싶다면, 이것이 제가 취할 경로입니다.
- 근거가 있는 프롬프트를 하나 선택합니다. “부드러운 조명의 책상 장면, 음침한 색상, 천연 목재, 혼란 없음”처럼 친숙한 것입니다.
- 터보에서 6-8개의 이미지를 실행합니다. 실제로 사용할 것 하나를 주목합니다.
- 같은 시드(또는 가까운 시드)를 사용하여 베이스로 전환합니다. CFG 7-8을 설정합니다.
- 당신에게 중요한 네거티브 프롬프트를 추가합니다(거친 그림자 없음, 렌즈 플레어 없음, 기울어진 각도 없음).
- 참고가 있다면, 팔레트 또는 레이아웃을 보통 가중치(0.3-0.5)로 적용합니다.
- 첫 변형은 강도 ~0.5를 사용합니다. 작은 단계로 위 또는 아래로 밉니다.
- 개선하는 것을 유지합니다. 싸우는 것을 취소합니다. 완벽함을 추구하지 마십시오: 반복 가능성을 추구하십시오.
이것이 저에게 효과적이었고, 당신의 경험은 다를 수 있습니다. 차이는 단일 “와우” 이미지에서가 아니라 작고 따분한 수정 사항을 요청했을 때 모델이 어떻게 반응하는지에서 나타났습니다. 그것이 도구가 잘 나이를 먹거나 소음이 나는지 여부입니다.
마지막 한 가지 주의: “Z-Image-Base란 무엇인가요”가 스펙 이상인지 궁금하다면, 저에게는 이것입니다. 작은 결정들이 유지되도록 하는 모델입니다. 저는 불꽃놀이보다 이것을 선택하겠습니다.





