Firered Image EditがWaveSpeedAIに登場

FireRed Image Editのご紹介：最先端の自然言語画像編集

WaveSpeedAIは、FireRed Image Editの提供開始を発表します。これはXiaohongshuのFireRedチームによる強力なAI画像編集モデルで、複数の編集ベンチマークで最先端のパフォーマンスを発揮します。拡散トランスフォーマーとして構築されたFireRed Image Editは、自然言語理解とマルチ画像合成を組み合わせ、シンプルなテキスト指示で精密かつ高品質な編集を実現します。

FireRed Image Editとは？

FireRed Image Editは、9億のテキスト→画像ペアと7億の画像編集ペアからなる16億サンプルの大規模コーパスで学習した汎用画像編集モデルです。厳格なデータキュレーションと多段階フィルタリングを経て、1億以上の高品質サンプルが選別され、事前学習・教師ありファインチューニング・強化学習にまたがるトレーニングパイプラインに使用されています。

FireRed Image Editの特徴は、複数のリファレンス画像を同時に扱える点にあります。単一の画像を単独で編集するのではなく、人物・物体・環境・スタイルの参照画像を複数アップロードし、それらを組み合わせる方法をテキストで指示できます。モデルは自然な構図・照明・遠近感を保ちながら要素をインテリジェントに合成します。

英語と中国語の両方のプロンプトに対応しており、グローバルチームと中国語ワークフローのどちらにも効果的です。

主な特徴

マルチ画像合成

FireRed Image Editの最大の強みは、複数のリファレンス画像の要素を一つのまとまった出力に組み合わせる機能です。人物の写真と服の写真をアップロードして、モデルにそれらを組み合わせるよう指示できます。プロンプト内で画像を番号で参照できます（「Figure 1の人物にFigure 2の服を着せてください」など）。どの要素をどこに配置するかを正確に制御できます。

自然言語の精度

英語または中国語でシンプルに編集内容を記述できます。「空を夕焼けに変えてください」といった単純な変更から、「パターンを維持しながらドレスの色を赤に変えてください」のような複雑な複数ステップの指示まで、FireRed Image Editは高い精度で指示に従います。標準化されたベンチマークでプロンプト追従精度は約65.7%を達成しており、同クラスの中でも最高水準に位置します。

ベンチマークをリードするパフォーマンス

FireRed Image Editは主要な編集ベンチマークでトップクラスのパフォーマンスを確立しています：

GEdit Benchmark：スコア7.92で、Qwen-Image-EditやSeedream 4.0などのクローズドソース競合を上回る
ImgEdit Benchmark：オープンソースモデルの中で最先端
REDEdit-Bench：15の編集カテゴリにわたってリードする結果

追加・調整・置換・削除・スタイライズ・テキスト編集といった一般編集の各次元で、FireRed Image Editはオープンソース・プロプライエタリシステムの双方を含む比較において一貫してトップまたはトップ付近にランクされています。

インテリジェントブレンディング

モデルは異なるソースの要素を合成する際、照明・遠近感・スタイルを自動的に適応させます。照明条件の不一致や不自然な合成を気にする必要はなく、モデルが視覚的なハーモナイゼーションを担います。

組み込みプロンプトエンハンサー

編集内容の表現方法がわからないときも安心です。FireRed Image Editには組み込みのプロンプト強化ツールが含まれており、より良い結果のために記述内容を自動的に洗練させ、高品質な出力を得るためのハードルを下げます。

バイリンガルサポート

英語と中国語の両方のプロンプトをネイティブにサポートし、同等の習熟度を発揮します。西洋市場と中国市場にまたがって活動するEコマースチーム・マーケティングエージェンシー・コンテンツクリエイターにとって特に価値があります。

実際のユースケース

バーチャル試着

人物の写真と別の服の写真をアップロードして、モデルにそれらを組み合わせるよう指示します。FireRed Image Editは、正確なしわ・影・体へのフィット感を再現したリアルな合成画像を生成し、ファッションEコマースに最適です。

製品ビジュアライゼーション

コストのかかる撮影なしに、さまざまな環境や異なるモデルに製品を配置できます。家具をさまざまな部屋のシーンで見せたり、時計を異なる手首に表示したり、パッケージデザインを小売環境でプレビューしたりできます。

キャラクター合成

キャラクターの特徴を新しい環境・アクセサリー・ポーズと組み合わせます。ゲーム開発者・アニメーター・コンセプトアーティストは、リファレンス画像の要素を組み合わせることでキャラクターデザインを素早くプロトタイプできます。

マーケティングと広告

ブランドアセット（ロゴ・製品・背景・モデル）を洗練されたコンポジションに組み合わせることで、カスタマイズされたキャンペービジュアルを作成できます。スタジオに戻ることなく、複数のバリエーションを素早く繰り返し作成できます。

古い写真の修復

合成だけでなく、FireRed Image Editは古い写真の修復・強化にも優れており、色あせた・損傷した画像を高品質で自然な見た目の結果によって蘇らせます。

スタイル転送

コンテンツと構造を保ちながら、ある画像のビジュアルスタイルを別の画像に適用します。写真を絵画に変換したり、シネマティックなカラーグレーディングを適用したり、一連のマーケティング素材全体でビジュアルスタイルを統一したりできます。

WaveSpeedAIでの使い方

WaveSpeedAIでFireRed Image Editを使うのはわずか数ステップです：

モデルページにアクセス：wavespeed.ai/models/wavespeed-ai/firered-image-editにアクセス
リファレンス画像をアップロード：組み合わせたい要素を含む全ての画像を追加
プロンプトを入力：特定の画像を参照するために「Figure 1」「Figure 2」などを使って編集内容を記述
サイズを設定（任意）：出力サイズを指定するか、空白にして最初の画像のアスペクト比に合わせる
生成：送信して編集済み画像をダウンロード

WaveSpeedAI APIを通じて直接統合することもできます：

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/firered-image-edit",
    {
        "prompt": "Put the person from Figure 1 in the outfit from Figure 2 in a modern office setting",
        "images": [
            "https://example.com/person.jpg",
            "https://example.com/outfit.jpg",
        ],
    },
)

print(output["outputs"][0])

1画像あたり$0.08で、FireRed Image Editは手動編集や従来の撮影の何分の一かのコストでプロフェッショナルクオリティの結果を提供します。

なぜWaveSpeedAIなのか？

WaveSpeedAIは、本番環境でFireRed Image Editにアクセスする最速かつ最も信頼性の高い方法を提供します：

コールドスタートなし：ウォームアップ遅延ゼロでリクエストの処理をすぐに開始
高速な推論：最適化されたインフラが数秒で結果を提供
手頃な料金：隠れた料金のない透明な従量課金制
本番対応API：アプリケーションやワークフローにシームレスに統合

今すぐ編集を始めましょう

FireRed Image Editは、マルチ画像合成・バイリンガル自然言語理解・ベンチマークをリードするクオリティを一つのモデルに集約した、指示ベース画像編集の最先端を体現しています。バーチャル試着体験の構築・製品撮影の自動化・スケールでのマーケティングビジュアルの作成など、どのような用途でも、FireRed Image Editは必要な精度と品質を提供します。

今すぐWaveSpeedAIでFireRed Image Editをお試しください：wavespeed.ai/models/wavespeed-ai/firered-image-edit——セットアップ不要、コールドスタートなし、最先端の画像編集にすぐにアクセスできます。