#image-generation
275 articles - Page 9
WaveSpeedAIでMidjourneyテキスト画像生成が利用可能に
Midjourneyの高度な創造的解釈を使用して、テキストプロンプトから高品質で芸術的な画像を生成します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAI LongCat Image EditがWaveSpeedAIに登場
LongCat-Image Editは美団から提供される6Bパラメータのバイリンガル(中国語-英語)画像編集モデルで、多言語テキストレンダリング、フォトリアリズム、デプロイメント効率に優れています。最高のパフォーマンスと冷え込みのないRESTインファレンスAPIがすぐに使用できます。
LongCat-ImageテキストツーイメージがWaveSpeedAIに登場
LongCat-ImageはMeituan社による60億パラメータの二言語対応(中国語・英語)テキストツーイメージモデルで、多言語テキストレンダリング、フォトリアリズム、デプロイメント効率に優れています。最高のパフォーマンスと低レイテンシーを実現するREST推論APIが使用可能です。
WaveSpeedAIにAlibaba WAN 2.6テキスト-画像生成が登場
Alibaba WAN 2.6テキスト-画像生成は、自然言語プロンプトから高品質な画像を生成し、プロンプト忠実度と構図の清潔性に優れています。複数のアスペクト比とサイズ制御、シード基づく再現性、写真的からイラスト的まで柔軟なスタイル(広告、商品撮影対応)をサポートしています。
Alibaba WAN 2.5 テキスト・ツー・イメージが WaveSpeedAI で利用可能に
Alibaba WAN 2.5 テキスト・ツー・イメージは、WAN 2.5 モデルを使用してテキストプロンプトを AI 生成画像に変換し、オンデマンド画像生成を実現します。すぐに使用できる REST 推論 API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ByteDance Seedream V4.5 Edit on WaveSpeedAIが利用可能に
ByteDance Seedream 4.5 Editは、参照画像から顔の特徴、照明、色調を保持し、強力なプロンプト準拠により4Kまでの専門的で高品質な編集を実現します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ByteDance Seedream V4.5 Edit Sequential がWaveSpeedAIで利用可能に
Seedream 4.5 Edit Sequentialは、複数の画像を編集する際にショット全体でキャラクターとオブジェクトのアイデンティティをロックします。主要な被写体を検出し、連続性を保ち、制御された編集を適用でき、最大4K出力に対応しています。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定
InfiniteYouがWaveSpeedAIに登場
InfiniteYou AIフェイススワップ - ByteDanceのゼロショット恒等性保存技術により実現される高品質なフェイススワップ。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAI Z Image LoRA トレーナーを WaveSpeedAI で発表
Z-Image-LoRA-trainer - カスタム Z-Image LoRA モデルを 10 倍高速でトレーニング - WaveSpeedAI
Google Nano Banana Pro Edit MultiがWaveSpeedAIに登場
GoogleのNano Banana Pro(Gemini 3.0 Pro Image)Editは、1回の実行で複数の高品質な編集画像を生成できる次世代の画像編集モデルです。非常に低コスト — 1枚あたり$0.07のみ。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Google Nano Banana Pro テキスト画像生成がWaveSpeedAIに登場
Google の Nano Banana Pro(Gemini 3.0 Pro Image)は、携帯電話向けに最適化された高解像度4K画像生成を可能にする最先端のテキスト画像生成モデルです。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAI Z Image Turbo LoRAがWaveSpeedAIで利用可能に
Z-Image-Turbo LoRA (6B)は、外部LoRAサポートを備えた超高速テキスト画像生成を実現します。サブ秒のレイテンシーで写真のようなリアルな画像を生成し、最大3つのLoRAを適用してカスタムスタイルを実現できます。すぐに使えるREST API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。