Z-Image Turbo Image-to-Image: 一貫した結果のための最適なデノイズ/強度値

Z-Image Turbo Image-to-Image: 一貫した結果のための最適なデノイズ/強度値

こんにちは、私はDoraです。

その日、小さな問題が発生しました。気に入ったスケッチがあり、クライアント資料用に3つのバリエーション(同じレイアウト、異なるムード)が必要でした。通常のセットアップはコピーが正確すぎるか、逆に勝手に変わってしまいます。Z-Image Turbo Image-to-Imageについてよく耳にしていたので、先週(2026年1月)実際のタスクで試してみました。劇的な結果ではありません。ただ一貫した結果を出し、ドラフトをエクスポートし、パラメータを調整し、何が変わり何が変わらないかを観察していました。

目立ったのは、速度や派手さではなく、denoise/strength設定の振る舞い方でした。微妙な差ですが、モデルがソース画像を尊重するか、それとも漠然とした提案として扱うかを決定します。これらはそれらの実行からのフィールドノートです。Z-Image Turbo Image-to-Imageでstrength/denoiseが実際に何をするのか、合理的に思える範囲、小さな一貫性のレシピ、ネガティブプロンプトが有効な場面、何が破綻するのか、そして午後を棒に振ることなくテストする簡単な方法です。

strength/denoiseが何をするのか

Z-Image Turbo Image-to-Imageのstrength(denoiseと呼ばれることもある)は、各パス時にモデルがソース画像をどの程度「忘れるか」を制御します。低いstrengthは軽いタッチを意味し、エッジ、ポーズ、構図はほぼそのまま保たれます。高いstrengthは創造的な自由度を意味し、スタイルの変更がより強力に反映され、構造がより柔軟になります。

実際の使用感はこんな感じでした:

  • 低い値では、レイアウトと大まかな形状の正確な保存が見られました。テクスチャはうまく変わり、カラーグレーディング、ライティング調整、マテリアルシフトがありましたが、基本的な構造は変わりませんでした。仕上げに最適です。
  • 中程度の値では、サーフェスの再解釈が始まりました。被写体を失わずにスタイル(インク対ペイント、光沢対マット)とライティング方向をナッジするのに十分でした。これが私のデフォルトゾーンでした。
  • 高い値は、同じプロンプトから新しい見方が欲しい場合に最適で、ソース画像をゴーストのような存在として使用します。顔と手がより動きました。背景が流動的になります。時にはそれが望むことですが、多くの場合はそうではありません。

小さな瞬間がありました。より多くのスタイルを「得る」と思ってstrengthを上げたのですが、代わりにデッキが依存していたきれいなシルエットを失いました。strengthを下げることは、どんな巧妙なプロンプト調整よりもスタイル一貫性に役立ちました。このツールは私に思い出させました、フレームを気にするなら、ソースを尊重しろということです。

推奨範囲

すべてのモデルビルドは少し異なるため、厳密な数字には慎重ですが、Z-Image Turbo Image-to-Imageで機能したのは以下の通りです(768~1024pxのソース、標準サンプラー、デフォルトCFGでテスト):

  • 0.15~0.25:ポーリッシングゾーン。ポーズとレイアウトをほぼ正確に保つ:仕上げを変更します。カラーグレーディング、微妙なテクスチャ、きれいなエッジ。アラインメントが重要な製品ショットやスライドに最適です。
  • 0.30~0.45:制御されたリスタイル。構造を維持:ムードをシフト。平坦から絵画的へ、ライティング方向を調整、パレットを展開します。これが私の日常的な範囲でした。
  • 0.50~0.65:大胆な再解釈。ポーズとシーンは緩く保たれます。概念探索やラフな連続性のみが必要なサムネイルに最適です。
  • 0.70以上:思い出のある新しいアイデア。ソースは提案になります。行き詰まった時に便利で、一貫性が必要な場合はリスクがあります。

3つのユースケース(スタイル/ポーズ/修正)

1. スタイル

平坦なベクターマスコットが「印刷テクスチャ」ルック、紙粒、わずかなインクにじみ、くすんだパレットが必要でした。Z-Image Turbo Image-to-Imageを0.35のstrengthと短いスタイルプロンプトで使用すると、キャラクターのエッジが保たれ、信頼できるマテリアルが追加されました。最初の実行はノイズが少し多すぎました。strengthを0.28に下げると、グレーンはハイライトではなくシャドウに落ち着きました。最初の試みで時間を節約しませんでしたが、3つのバリエーション全体で精神的負担が減りました。マスキングなし、手動グレーンオーバーレイなし。

役に立ったこと:

  • 短いプロンプトは詩的なものより勝ります。モデルは「risograph-style, soft paper grain, muted CMYK」に対して、空気のような形容詞より良く反応しました。
  • ソースをくっきり保つ。ぼやけた入力は、濁ったグレーンをくれました。

2. ポーズ

body languageを保ちながら、キャラクターの別のアングルが必要でした。strength 0.40前後で、いくつかのプロンプトヒント(カメラアングル、レンズ)を使用して、シーンを約15~25度回転させることができました。0.55に上げるのは冒険的でしたが、時には魅力的で、時には不適切でした。軽いラインアート(シルエットと主要な襞だけ)をソースの上で実行すると、完全にシェーディングされた入力よりもポーズが保たれることに気づきました。

役に立ったこと:

  • スケッチのようなソースは意図を保存します。モデルは線を尊重します。
  • 手が破綻する場合、最初にstrengthを下げ、その後ガイダンスを調整します。inpaintの修正は最後です。

3. 修正

Z-Image Turboを使用して製品合成を整理しました:より良い反射、グレアの軽減、よりスムーズなエッジ。これは低strengthが輝いた場所でした。0.18~0.22では、ツールはより賢いフィルターのように機能し、ジオメトリを保持し、アーティファクトを滑らかにし、ライティング一貫性を調整しました。0.30を超えると、後で描き直す必要があった背景の詳細を発明し始めました。

役に立ったこと:

  • 「余分なオブジェクト、テキスト、ロゴバリエーション」に対するネガティブプロンプトを追加して、パッケージを幻覚することがないようにします。
  • 安全な修正が欲しい場合、1つの重い処理ではなく、2つの素早いパスを実行します。

一貫性レシピ

レイアウト一貫性を失わずに複数の画像から画像へのバリエーションを生成する必要がある場合、これはまさにWaveSpeedを作った目的です。ローカルセットアップを処理したり、盲目的に実験を再実行したりする代わりに、固定シードで反復し、strengthの範囲を比較し、ソース画像がバリエーション全体で尊重されることを保つことができました。

WaveSpeedでZ-Image Turbo Image-to-Imageを試す これは、関連していても、クローンではない一連のシリーズが必要な場合に使用した小さなセットアップです。派手ではなく、単に揺らぎを減らすものです。

レシピ(2026年1月実行):

  • Strength:リスタイルで0.30~0.38、ポリッシュで0.18~0.25。
  • Seed:各バリアントセットに対してロック。新しいブランチが欲しい場合のみ変更。
  • Guidance (CFG):中程度(5~7)。高い値は形容詞に向かって引っ張りすぎ、ソースから離れすぎました。
  • Prompt:1つのタイトなディスクリプタスタック(マテリアル、ライティング、パレット)と1つの短いシーンキュー。メタファーなし。
  • Input:きれいなエッジ、一貫した解像度。生成前にソースを同じ最長辺にアップスケーリングしました。
  • Sampler/steps:デフォルトサンプラーで控えめなステップで十分でした。デフォルト以上のステップは収穫逓減が見られました。バンディングが出た場合のみ推し進めました。

プロセスノート:

  • スロットマシンのように反復するのではなく、デザイナーのように反復します。一度に1つの変数を変更します。A/Bを並べて保存します。
  • モデルが常に漂流する場合、プロンプトで戦う前にstrengthを下げます。これは通常、語彙の問題ではなく、尊重の問題です。
  • 実行がテクスチャは正しいが色が間違っている場合、シードを保持してパレット用語を変更します。ポーズは正しいがテクスチャが間違っている場合、strengthを保持してスタイルスタックを交換します。

ネガティブプロンプト

ネガティブプロンプトはここでは魔法の杖のようには感じられませんでした。ガードレールのように感じられました。小さく、永続的なアーティファクトを防ぐために使用しました。

役に立ったこと:

  • 製品ショット用: 「extra labels, duplicated logos, random text, additional reflections, chromatic aberration」。幻の色を失ったステッカーとゴーストハイライトをクリーンアップしました。
  • キャラクター用: 「extra fingers, extra limbs, messy pupils, asymmetrical eyes」。すべての解剖学的すべり防止にはなりませんでしたが、頻度を減らしました。
  • シーン用: 「floating objects, busy background, posterization」。mid/high strengthで背景が詰まるのを防ぐのに役立ちました。

パターン:ネガティブはstrengthがすでに合理的な場合、より効果的です。strengthが高すぎる場合、ネガティブは爪楊枝で氷を操作しようとするような感じになります。

失敗モード

Z-Image Turbo Image-to-Imageが反発した予測可能な場所がいくつかありました:

  • Over-stylization drift:strength >0.55で説明的なプロンプトを使用すると、ツールは解剖学より気分を優先しました。手とテキストが最初に被害を受けました。修正:strengthを下げ、形容詞を減らし、入力解像度を上げます。
  • Texture inflation:「grainy, gritty, distressed, filmic」のようなスタックテクスチャ用語を求めました。斑点のあるシャドウとバンディングに増幅されました。修正:1つのテクスチャファミリーを選択、短く保つ。
  • Face uncanny valley:セット全体の小さな顔のシフトにより、キャラクターは同じ人ではなく、いとこのように見えました。修正:シードをロック、strengthを0.35以下に保ち、必要に応じて軽い顔固有のパスを実行します。

これはZ-Image Turboに限った話ではありませんが、閾値が重要でした。strengthを主要なダイアルとして、プロンプトを調味料として扱うことを学びました。その逆ではなく。

ミニテストグリッド法

どこに着地すべきかわからない場合、小さくて退屈なグリッドを実行します。1時間、自分の尻尾を追いかけるのを防ぎます。

これは先週Z-Image Turbo Image-to-Imageに使用したグリッドです:

  1. シード、サンプラー、解像度を修正します。プロンプトを非常に短く、マテリアルラインとパレットラインに保ちます。
  2. 3×2グリッドを作成:3つのstrength(0.22、0.34、0.48)が横に、2つのCFG(5および7)が下に。これでスペースを迅速にマッピングする6つの画像が得られます。
  3. ソースを最もよく尊重しながらスタイルをヒットするセルを選択します。何も適さない場合は、1軸のみを調整します。例:同じCFGで0.28、0.38、0.44を試します。
  4. 適切なセルが見つかったら、その中で遊びます。strengthを固定し、1つの説明的な用語またはパレットを変動させます。セットとして保存します。

タイミング:これは私の場合、768~1024pxで控えめなGPUで概念ごとに約12~15分かかりました。ポイントは速度ではなく、盲目的なジャブが少なくなることです。

小さなヒント:ファイル名にstrength-CFGでラベルを付けます。クライアントが「2番目のもの」と言ったとき、どのレバーを再生するかを知っているでしょう。

また、「strengthをちょっと調整して3つのムードを変える」と誓った直後に、誤って0.6に押し上げて、すべてのキャラクターが「家族ドリフト」モードに入ってしまったことはありませんか?

素早く、あなたのスケッチをZ-Image Turbo Image-to-Imageに投げ、denoiseフィーチャーを試してみてください。