Z Image Turbo Image To ImageがWaveSpeedAIに登場 LoRA

Z-Image-Turbo Image-to-Image LoRA が WaveSpeedAI に登場

AI 画像変換の世界は、大幅に強力で高速になりました。最大3つのカスタム LoRA アダプターを組み合わせた多目的モデル Z-Image-Turbo Image-to-Image LoRA の発表をお知らせします。既存の画像を強化したり、芸術的スタイルを転送したり、プロジェクト全体でキャラクター一貫性を保つなど、このモデルは1秒以下でプロフェッショナルな結果を提供します。

Z-Image-Turbo Image-to-Image LoRA とは？

Z-Image-Turbo Image-to-Image LoRA は、Scalable Single-Stream DiT（S3-DiT）アーキテクチャ上に構築された 60 億パラメーターの画像生成モデルです。50 以上のステップが必要な従来の拡散モデルとは異なり、Z-Image-Turbo はわずか 8 回の関数評価で同等の品質を実現しており、現在利用可能な最速の本番対応画像変換モデルの1つです。

このモデルの特徴は、完全な LoRA（Low-Rank Adaptation）サポートです。LoRA は軽量でモジュール化された重みセットで、モデルの完全な再トレーニングを必要とせずに、基本モデルを特定の美学、キャラクター、またはスタイルに適応させます。最大3つの LoRA を同時にサポートすることで、Z-Image-Turbo はそのシグネチャー速度を維持しながら、画像変換に前例のないコントロールを提供します。

これは単なる編集ツールではなく、参照画像ガイダンスとカスタムスタイルコントロールを統合する完全な生成エンジンです。

主な特徴

1秒以下の生成: 画像を 0.8～1.2 秒で変換し、リアルタイムワークフローと迅速な反復を実現
トリプル LoRA サポート: 最大3つのカスタム LoRA アダプターを同時に適用して、キャラクター、スタイル、ブランドの一貫性を実現
柔軟な変換スペクトラム: 単一の強度パラメーターで、微妙な強化から劇的な再解釈まで出力強度をコントロール
品質強化モード: 低強度値（0.0～0.3）で、微妙な LoRA スタイルを適用しながら画像品質を改善
クリエイティブ再解釈モード: 高強度値（0.8～1.0）で、LoRA スタイルが完全なビジュアル変換を支配
二言語テキストレンダリング: 速度を維持しながら、画像内に英語と中国語のテキストを直接生成
組み込みプロンプト強化: プロンプトを自動的に改善してより良い結果を実現
シンプルな定額料金: サイズ、強度、LoRA 数に関係なく画像あたり $0.01

強度パラメーターの理解

強度パラメーターは、元の画像と LoRA の影響のバランスを取るための主要なコントロールです：

強度	効果	最適な用途
0.0～0.3	最小限の変更—微妙な LoRA ヒントで品質を強化	アップスケーリング、品質改善
0.3～0.6	中程度の変更—構造を保持しながらスタイルをブレンド	スタイル融合、キャラクター一貫性
0.6～0.8	大きな変更—強い LoRA の影響を保持しながら構成を保持	スタイル転送、芸術的再解釈
0.8～1.0	最大の変更—LoRA スタイルが完全に支配	完全な変換、クリエイティブな再解釈

リアルワールドユースケース

キャラクター変換

キャラクター LoRA を適用して、元のポーズ、構成、コンテキストを保持しながらサブジェクトを変換します。異なるシーン全体で一貫したキャラクター外観を作成したり、既存の写真を特定の美学に適応させるのに最適です。

ブランド一貫性

マーケティングチームは、カスタムブランド LoRA を使用して、任意の画像を企業ビジュアルガイドラインに合致させるように変換できます。製品写真、チームポートレート、またはキャンペーン画像をアップロードして、確立されたブランドアイデンティティに即座に整列させます。

精密なスタイル転送

効果を均一に適用する従来のスタイル転送とは異なり、Z-Image-Turbo ではスタイル影響を正確にコントロールできます。異なるスケールで複数のアートスタイル LoRA をブレンドして、ユニークなハイブリッド美学を作成します。

スタイル付きの品質強化

低強度設定では、モデルは画像品質の改善—詳細をシャープにし、解像度を強化し、元の構成を劇的に変更することなく微妙なスタイリッシュなタッチを追加することに優れています。

芸術的再解釈

クリエイティブプロフェッショナルは、複数の LoRA を組み合わせて、まったく新しいビジュアル方向を探索できます。写真をイラストに変換したり、ヴィンテージフィルム美学を適用したり、複数の芸術的影響をまったく新しいものにマージしたりします。

WaveSpeedAI でのはじめ方

WaveSpeedAI で Z-Image-Turbo Image-to-Image LoRA を使用するのは数分で始められます：

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/z-image-turbo/image-to-image-lora",
    {
        "prompt": "A portrait in vibrant watercolor style",
        "image": "https://example.com/your-image.jpg",
        "strength": 0.6,
        "loras": [
            {"path": "https://your-lora-url.safetensors", "scale": 1.0}
        ]
    },
)

print(output["outputs"][0])

主要パラメーター:

prompt: 変換をガイドするテキスト説明
image: ソース画像（URL またはアップロード）
strength: 0～1 の変換強度（デフォルト: 0.6）
loras: パスとオプションのスケールを持つ最大3つの LoRA アダプターの配列

最良の結果を得るには、元の画像と LoRA 影響の間の正しいバランスを見つけるために、0.5～0.6 の強度から始めてください。LoRA がトリガーワードを使用する場合、最適なスタイルアクティベーションのためにプロンプトに含めてください。

なぜ WaveSpeedAI？

WaveSpeedAI はコールドスタートなしで業界最速の推論速度を提供します。画像は毎回即座に生成され、モデルのウォームアップやキューの遅延を待つ必要はありません。わかりやすい画像あたり $0.01 の料金と組み合わせて、予算を心配することなく自由に反復処理できます。

プラットフォームは、Civitai および Hugging Face などの人気のあるソースから LoRA 重みを直接ロードすることをサポートしており、コミュニティが作成した数千のスタイルに即座にアクセスできます。または、Z-Image LoRA Trainer を使用して独自のカスタム LoRA をトレーニングして、特定のサブジェクト、キャラクター、またはブランド美学をキャプチャします。

今日から変換を開始

Z-Image-Turbo Image-to-Image LoRA は AI 画像変換における新しいパラダイムを表しており、本番ワークフローに必要な速度とアーティストと開発者が求める創造的柔軟性を組み合わせています。リアルタイムの画像処理が必要なアプリケーションを構築するか、個人プロジェクト用に新しいクリエイティブな方向を探索するかにかかわらず、このモデルが提供します。

Z-Image-Turbo Image-to-Image LoRA を WaveSpeedAI で試す →