Z-Image-Baseとは?完全なCFG制御 vs ターボスピード

Z-Image-Baseとは?完全なCFG制御 vs ターボスピード

こんにちは、私はDoraです。最近、小さなことで悩まされています。バナーグラフィックスがちょっと…おかしくなるのを止めたかったのです。色がズレる。顔が不気味に傾く。そして、一つのものを修正しようとすると、別のものがズレてしまう。最後に私をイライラさせた小さな摩擦はこれでした:結果を少しも調整できず、画像全体のバランスが崩れてしまうのです。

それで、先週と再びこの月曜日の朝(2026年2月)、Z-Image-Baseをその高速な兄弟分であるZ-Image-Turboと一緒に試してみました。私は速度を追い求めていませんでした。より安定した操作、期待通りに動作するプロンプト、定着する調整、実行間の精神的な手間をより少なくしたかったのです。

Z-Image-Baseとは?

Z-Image-Baseは、生の速度よりも制御と予測可能性に傾いた6Bパラメータの画像生成モデルです。Turboがスプリントのように感じるなら、Baseは地図を持った着実な散歩のように感じます。参照と一致させようとしたり、ブランドカラーを一貫して保つ、または見失わずに1つのビジュアルコンセプトを繰り返し実行しようとしている場合に、実際に重要な多くのノブを公開しています。

6Bパラメータアーキテクチャの概要

私はパラメータ数を崇拝するためにここにいるわけではありませんが、6Bマークは何か簡単なことを示しています:小さな変化で崩れることなくスタイルと構造を保つのに十分な容量。実際には、2026年2月2~3日のテスト中に2つのことに気づきました:

  • 編集がより清潔に積み重なった。色温度や照明を変更しても、構成を消去することは少なくなりました。
  • シードは実行全体で、より予測可能に動作しました。シードをロックして誘導強度を調整すると、シーンはリセットされるのではなく進化しました。

それはフードの下の拡散スタイルの体験です:誘導スケール、ノイズスケジュール、ステップとシードの通常のダンス。理論を気にしているなら、これが分類器なしの誘導が役割を果たすところです。しかし、私にとって重要だったのは:私の小さなプロンプト変更は出力に対して比例したように感じました。

Z-Image-Turboとの主な違い

Turboはより安く、高速です。素早いコンセプトスウィープ、サムネイル、ムードボード、ソーシャルドラフトに最適です。しかし、私は同じ壁に何度も走りました:一度好きなものになると、正確なバリエーション(より暖かいトーン、より柔らかい影、わずかにタイトなクロップ)を取得するのに予想以上の時間がかかりました。

Baseはより細かい制御をくれました。ネガティブプロンプトはより堅く付き、参照画像はそれを要求したときにより多くの牽引力を持ち、CFG調整はジャンピーではなく線形に感じました。実行はより遅く、画像ごとにより多くの費用がかかりました。しかし、忠実度が重要なタスクでは、より少ない再試行で補われました。

Z-Image-Baseのコア機能

これらは記憶するための箇条書き機能ではありません。これらは私が自分を使用していることに気づいたレバーであり、そうしたときに何が変わったかです。

完全なCFGサポート

Baseを使用すると、誘導は光のスイッチではなく、調光器のように動作しました。より低いCFGはモデルを探索させ、プロンプトが硬すぎると感じたときに便利です。より高いCFGはテキストに画像をスナップしましたが、より小さいまたは過剰にチューニングされたモデルで時々見られる脆く、オーバーコントラストされた見た目なしで。

実際のパスで:記事ヘッダーのシリーズを生成しました(「穏やかなワークスペース、ミュート色、自然光、最小限のクラッター」)。CFG 4~5で、柔らかく、雰囲気のある結果を得ました。素敵ですが、曖昧です。7~8では、構成がロックされました:机、窓の光、清潔なラインです。10以上では、詳細は過度に適合し始めました(厳しいエッジ、有機的な光が少なくなります)。私の甘いスポットはこのスタイルで約7.5に落ち着きました。

ネガティブプロンプトコントロール

これはBaseが私の信頼を獲得した場所です。「レンズフレアなし、光沢のある反射なし、傾いた角度なし」と尋ねたとき、モデルは実際に背後にありました。Turboの場合、メインプロンプトがシネマティックに傾いた場合、これらのメモは無視されることもありました。

小さな例:製品ショットモックアップの場合、「鏡面ハイライトなし」プラス「マット仕上げ」は、8回のうち6回を通じて一貫した表面を生成しました。完璧ではありませんが、すべてのレンダリングを手で修正していなかったのに十分一貫性がありました。精神的な負荷が低下し、微調整の修正が少なくなりました。

参照画像ガイダンス

2つのリファレンスを使用しました:ブランドカラーカードと過去のデザインからのレイアウトフレーム。Baseは参照の重みを高く設定したときに両方をより強く尊重しました。色はパレットと一致する範囲内(正確ではありませんが、再描画する必要がなかったのに十分近い)で保持され、構成はフレーム内にとどまり、硬直的には感じませんでした。

トレードオフがあります。参照の重みを非常に遠くに押すと、ソースの古いエコーが得られます。適度に保つと、クローンなしで継続性が得られます。私にとって、ブランドの一貫性が必要な場合、0.35~0.55が正しかったです:ただ軽くタップしたかったときは0.15~0.25。

強度パラメータチューニング

ノイズ除去強度、画像から画像への強度、または単に「どのくらい変更すべきですか?」と呼んでください。ノブは重要です。Baseを使用すると、中程度の強度編集(私の実行では0.45~0.6周辺)はレイアウトを保持しながら、スタイルが進化させました。それは「同じシーン、別の気分」に最適です。

目立った2つの実行:

  • 正午の照明をオブジェクトの配置を失わずに遅い午後の温かさに柔らかくしました。1つのスライダー移動、1つの実行、完了。
  • テクスチャ背景を平らなものと交換しながら、サブジェクトマスクを十分に保つことで、シルエットを再撮影する必要がありませんでした。

これは最初は時間を救いませんでした。私は微調整しました。しかし、いくつかのパス後、私はそれが再試行を減らし、精神的な努力を減らすことに気づきました。モデルは私が求めたものを変更し、残りを単独で残しました。

BaseとTurboの選択

違いを感じるために、一日の間に2つの間で切り替えるのを続けました。選択は哲学的ではありませんでした:それは実用的でした。

Base:微調整制御が重要な場合に選択してください

  • ブランドパレットまたは定期的なレイアウトをマッチングしており、小さな偏差はコストがかかります。
  • ネガティブプロンプトが付着するのが必要です(光沢のある反射なし、視野の深さなし、傾いた地平線なし)クリーンアップ時間が増加するため。
  • 1つのコンセプトを複数の実行で繰り返し実行しており、照明やカラーを調整するたびに構成をリセットしたくありません。

Baseは独自の「より良い」画像を作成しませんでした。修正が保持された。それが勝利でした。

Turbo:速度が優先事項の場合に選択してください

  • 方向を探索し、多くのオプションを生成したり、素早くストーリーボードしたりしています。
  • 粗さで問題ありません。後で小さなサブセットを磨くことを計画しています。
  • コストは要因であり、最初に広いネットをキャストしたいです。

私のパターンは今:Turboで空間をマップし、保つ価値がある方向を見つけたらBaseに移動します。それは賢明に感じる2ギアシステムです。

価格比較

価格は変わりますが、ここに2026年2月初旬のテスト中に使用したものがあります。

Base:$0.01/画像

1画像あたり1セント、Baseは高くありませんが、使い捨てのような安くもありません。1つのビジュアルで深く反復する場合、20~40回の実行、追加の制御は多くの場合ダウンストリームで自分で支払うことができます(手動編集、再起動が少ない)。

Turbo:$0.005/画像

半分の価格とかなり速い。方向を見つけるために50~100の粗を生成するのに最適です。ワークフローが「理想的な広い、細い細い」の場合、Turboは最初のフェーズを買い得に保ちます。

クイックスタート

好奇心があり、ドキュメントを読まずに違いを感じたい場合、これは私が取るパスです。

  1. 1つの根拠のあるプロンプトを選んでください。「柔らかく照らされた机のシーン、ミュート色、天然木、クラッターなし」のような何か親しみやすい。
  2. Turboで6~8画像を実行します。1つを実際に使用したいメモを取ります。
  3. Base(または近いシード)と同じシードに切り替えます。CFG 7~8を設定します。
  4. あなたに重要なネガティブプロンプトを追加してください(厳しい影なし、レンズフレアなし、傾いた角度なし)。
  5. 参照、パレット、またはレイアウトがある場合、適度な重みで適用します(0.3~0.5)。
  6. 最初のバリエーションの強度〜0.5を使用します。小さなステップで上下に押します。
  7. 改善することを維持してください。あなたを戦う撤去を取り消してください。完璧を追い求めないでください:反復可能性を追い求めてください。

これは私にとって機能しました、あなたの走行距離は異なるかもしれません。違いは1つの「ワオ」画像に表示されませんでしたが、モデルが小さくて退屈な修正を求めたときにどのように反応したかで。それは、ツールが十分に経年変化するか、大音量で取得するかです。

最後に注記:「Z-Image-Baseとは」仕様を超えて不思議に思っています。これは私にとっています。小さな決定が付着することができるモデルです。花火よりもそれを取ります。