ComfyUI Nano Banana Pro ワークフロー: インストール、ノード、ベストデフォルト設定

ComfyUI Nano Banana Pro ワークフロー: インストール、ノード、ベストデフォルト設定

ComfyUIのノードグラフを見つめながら、Nano Banana Proがインストールされているのに何もうまく動いていない…そんな状況を経験したことはありませんか?想像してみてください:きれいなインストール、すべての重要なノードが正しく配置され、最初の推論実行で既にデフォルト設定で問題が解決されている場面を。僕はドラ、このパスを何度も歩んできた友人です。この記事では、インストール、必須のノードセットアップ、そして混乱をスムーズなワークフローに変えるデフォルト設定を一緒に見ていきます。

ComfyUIが活躍する場面

コントロールが効いて後で問題が起きないようなワークフローが必要な時、プロンプトのルーティング、シード、解像度、そして結果を繰り返す清潔な方法が欲しい時に、僕はComfyUIに頼ります。単一のボックスでテキスト−画像生成は速いですが、小さな変更は複雑になります。ComfyUIなら、何が起きているか見えて、一度に一つのものを調整できます。

利益を得られるいくつかのケースがあります:

  • シードが重要で、来週も結果を再現する必要があるようなビジュアルスタイルを反復する場合。
  • SDXL と SD1.5 モデルを同じ日に混在させ、毎回 UI を学び直したくない場合。
  • 画像がどのように作られたかの記録を保持する。ComfyUIはデフォルトでグラフをPNGメタデータに書き込みます。これは素晴らしいことです。

クイックなムードボード素材やテンポラリーなサムネイルのためにComfyUIを開くことはありません。プロンプトから出力へのパスが読みやすくあるべき時に輝きます。ComfyUI Nano Banana Pro Workflowはその領域に存在します:秒単位で読み込めるほど小さく、将来の自分が過去の自分に呪いの言葉を吐かないほど明確です。

APIサイド(固定ルーティング、予期しないモデルスワップなし、明確な使用状況の可視性)で同じ種類の予測可能性が必要なら、WaveSpeedはモデルアクセスの安定と透明性を保つことに焦点を当てており、インフラストラクチャーがあなたがベビーシッティングしなければならないもう一つのものにならないようにします。

➡️Wavespeedを試してみてください!

ミニマルなノードグラフ

もう一つノードを削除するとより悪くなるまでグラフを削ぎ落としました。SD1.5 と SDXL の核は同じです:チェックポイントと解像度を入れ替えるだけです。

僕が着地した背骨はここです:

  • Checkpoint Loader(モデル+CLIP+VAEが一緒に)
  • CLIP Text Encode(ポジティブ)
  • CLIP Text Encode(ネガティブ)
  • Empty Latent Image(サイズ、バッチ)
  • KSampler(サンプラー、ステップ、CFG、シード)
  • VAE Decode
  • Save Image

オプショナルですが、まだ軽い:

  • Latent Upscale(最初からサンプリングし直さずにより大きな画像が欲しい場合)
  • Image Scale(最終的なピクセル リサイズ用)

ここでの静かな勝利は、レンダリングごとに1つのKSamplerです。凝ったリファイナーとスケジューラーをチェーンするのを試しましたが、グラフが混乱して出力の予測可能性が低下しました。このミニマルな装置なら、モデルを切り替えて精神的な地図を保つことができます。

フィールドノート:プロンプトノードをサンプラーの近くに保ち、画像ノードを右に押しやります。グラフを見たとき、「言葉→潜在→デコード→保存」が見えます。明らかに聞こえますが、レイアウトは私がどれほど穏やかに仕事をするかに影響します。

推奨デフォルト設定

デフォルトは、将来の自分のための時間を最も多く節約できる場所です。これらは僕が設定して、理由がない限り触らない値です。

モデル/解像度:

  • SD1.5:正方形の場合768×768。512より多くの詳細を与え、VRAMを確保します。

  • SDXL:実際にSDXLが必要な場合は1024×1024。それ以外の場合、ポートレート/シーンの場合は832×1216または1216×832に固定します。64で割り切れるとサンプラーが満足します。 サンプラー/ステップ/CFG(KSampler):

  • サンプラー:DPM++ 2M Karras

  • ステップ:18–24(SD1.5)、22–28(SDXL)

  • CFG:4.5–6.5(プロンプト強度に応じて)

ネガティブプロンプト:

  • 小さく、安定したセットを保つ。「blurry, extra fingers, overlapping limbs, watermark, low-res, jpeg artifacts」を使用します。意図的につまらなくしています。

バッチ処理:

  • 探索するときはバッチサイズ2–4、バッチ数1。VRAMが限界なら、ステップを触る前にスパイクを避けるためにバッチ数の代わりにバッチサイズを使用します。

これらのデフォルトは「十分な」そして予測可能な結果を生成します。より鮮明または洗練されたものが必要な場合、一度に一つのものを変更し、役に立たなければロールバックします。

一貫性設定

一貫性は主に小さなドリフトが複合するのを防ぐことです。いくつかのレバーが他のものより重要です。

シード規律:

  • 好きな方向が見えたらシードをロックします。固定シードでプロンプトを探索し、ノードを複製して新しいシードを試して堅牢性をチェックします。

プロンプト長:

  • 短いプロンプトはより速く安定します。段落を書いている自分に気づいたら、それを分割します:主体、スタイルヒント、照明。3行の方が1つの長話より良いです。

CFG衛生:

  • 高すぎるとモデルの学習した構造を刻印してしまいます:低すぎるとマッシュを得ます。僕の安定した出力のほとんどはCFG 5–6で着地しています。

解像度の変更:

  • 潜在を1.5–2倍にアップスケールするなら、同じシードとサンプラーを保ちます。大きなジャンプ(512→2048など)はフィーリングを変えます:スタイルがそれに耐えられない限り避けます。

バージョンノート:

  • 2026年1月のCurrent ComfyUI buildsと一般的なSD1.5/SDXLチェックポイントで、これをテストしました。スケジューラーは進化しますが、シード/CFGバランスはバージョン間で有用です。 実際には、これらの習慣はリレンダリングをカットします。1週間で、僕は小さいけど実在する利益を感じました、おそらく画像セットあたり3–5分が節約されたけど、より重要なことに、より少ない自己疑問です。

アップスケール戦略

僕は2つのパスを試して、プロジェクトのための穏やかな方を選びます。

パスA:潜在アップスケーリング

  • VAE Decode前にLatent Upscale(1.5倍または2倍)を使用します。
  • 同じシードとサンプラー設定を再利用します。
  • 長所:詳細の一貫性を保ちます:メモリで安い。
  • 欠点:2倍を超えてプッシュするとアーティファクトが忍び込みます。

パスB:デコード後の画像リサイズ

  • 最初にデコード、その後、ターゲットへのImage Scale(Lanczosがよく機能します)、オプショナルで軽いシャープンを行います。
  • 長所:クイック、レイアウト必要のための予測可能なサイズ変更。
  • 欠点:ピクセルを伸ばしており、新しい詳細を発明していません。

ポスターサイズの画像を配信する場合、時々ハイブリッドを行います:1.5倍の潜在アップスケール、デコード、その後、正確な寸法に当たるための小さな画像リサイズ。それは安定していて、「スマッジされたアップスケール」のように見えずに異なるノードを追いかけません。

一般的なノードエラー

これらは僕が最も多くぶつかり、どのようにしてそれを通り抜けるかのスナッグです。

  • モデル/CLIPミスマッチ:出力がスタイルの観点ではない方法で「オフ」に見える場合、チェックポイント、CLIP、VAEが調整されているか確認します。単一のCheckpoint Loaderはクロスワイヤリングを避けるのに役立ちます。
  • 64で割り切れないサイズ:潜在は清潔な倍数が好きです。ノードが文句を言ったり、画像が奇妙にクロップされたりする場合、寸法を最も近い64に丸めます。
  • CUDA OOM:最初にバッチサイズを低下させます。それで十分でなければ、ステップに触れる前に解像度を1ステップ低下させます(例:1024→896)。
  • シードが実際に固定されていない:一部のグラフはシードを静かに再初期化します。Seedノードをワイヤーするか、それをKSamplerに直接入力して、ドリフトのためのプレビューを見ます。
  • ネガティブプロンプトが接続されていない:忘れたとき、僕は「より大声」の画像を得ます。ネガティブエンコーダーノードをポジティブのものの視覚的に近く保って、ぶら下がっているワイヤーを避けます。

これのどれもドラマティックではありませんが、早期にそれらをキャッチするとセッションは落ち着きを保ちます。

エクスポートのヒント

後で設定を探したくありません。2つの習慣が役立ちます。

  • ファイル名:Save Imageで、シードとモデル名をファイル名に含める パターンを設定します。クライアントが「バージョン3、同じスタイル、より大きい」と聞くと、僕はそれを追跡できます。
  • 埋め込みワークフロー:ComfyUIはグラフをPNGメタデータに書き込みます。共有または再訪する必要がある場合、PNGをComfyUIに戻してロードし、グラフが再構築されます。追加のノートは不要です。
  • JSONバックアップ:構造的に何かを変更するときは、ワークフロー JSONを エクスポートします。モデルファミリーあたり1つの小さなテンプレートは物事をきれいに保ちます。

小さな詳細:僕は出力を日付フォルダに保ちます。派手ではありませんが、「10秒で見つけた」と「どこへ行った?」の違いです。

テンプレートダウンロードのアイデア

単一のComfyUI Nano Banana Pro ワークフローテンプレートを共有することを考えて、グラフの内部に2つのタブがあります:SD1.5用にサイズ設定されたもの1つ、SDXL用もう1つ、同じノード順序、同じ理健全なデフォルト。チェックポイントを交換し、プロンプトを設定して、潜在または画像アップスケールを選択します。

それは基本的に僕が今使っているグラフで、静かで、ラベルされ、一目で理解するのに十分軽いです。そして、スタイライザーとリファイナーを備えたより重いグラフが好きなら、それは公平です。1つのダイアルを動かすと何が変わるか見ることが好きです。

僕は削り続けます。一度に1つの小さな変更は、僕が知っている信頼できるものに到達するための最も速い方法です。