← 部落格

Qwen Image Edit 現已登陸WaveSpeedAI

Qwen-Image-Edit 是一個 20B MMDiT 圖像到圖像模型,提供精確的雙語(中文和英文)文字編輯,同時保留風格。現成可用的 REST 推論 API、最佳效能、無冷啟動、平價定價。

1 min read
Wavespeed Ai Qwen Image Edit
Wavespeed Ai Qwen Image Edit Qwen-Image-Edit 是一個 20B MMDiT 圖像到圖像模型,提供精確的雙語(中文和英文)文字編輯,同時保...
Try it
Qwen Image Edit 現已登陸WaveSpeedAI

隆重介紹 Qwen-Image-Edit:Alibaba 革命性的 20B 圖像編輯模型現已登陸 WaveSpeedAI

AI 驅動的圖像編輯領域剛剛迎來了劇烈的變革。WaveSpeedAI 非常興奮地宣布 Qwen-Image-Edit 正式上線——這是 Alibaba 推出的突破性 200 億參數圖像編輯模型,正在重新定義視覺內容處理的可能性。無論你是在編輯圖像中的文字、轉換風格,還是進行精確的語意變更,這個模型都能提供與閉源替代方案相媲美、甚至常常超越它們的最先進結果。

什麼是 Qwen-Image-Edit?

Qwen-Image-Edit 是建立在 Alibaba 強大的 Qwen-Image 基礎之上的進階圖像到圖像模型。其核心採用多模態擴散 Transformer(MMDiT)架構,並結合 Qwen2.5-VL——一款多模態大型語言模型——以實現精密的文字條件控制與理解。

這個模型的獨特之處在於它創新的雙重編碼方式:輸入圖像會同時由 Qwen2.5-VL 進行高層次的語意理解,並由 VAE 處理低層次的重建細節。這樣的架構讓模型能夠在進行複雜編輯時維持完美的語意一致性,同時在未變動的區域保留像素級的精準度。

根據基準測試評估,Qwen-Image-Edit 在 GEdit-Bench-EN 上整體取得 7.56 分,在中文基準測試上達到 7.52 分,甚至超越 GPT Image 1(英文 7.53、中文 7.30),並大幅領先 FLUX.1 Kontext Pro(英文 6.56、中文 1.23)。

主要功能

精確的雙語文字編輯

Qwen-Image-Edit 最令人印象深刻的能力之一,就是能夠直接在圖像中新增、刪除及修改文字——支援中文與英文——同時完美保留原始的字型、大小與風格。這使其在以下場景中極具價值:

  • 更新行銷素材與廣告
  • 在中英文市場之間進行內容在地化
  • 製作專業海報、書籍封面與資訊圖表
  • 編輯照片中的招牌與品牌內容

語意與外觀編輯

此模型支援兩種截然不同的編輯範式:

  • 低層次外觀編輯:在完全不影響其他區域的前提下,新增、移除或修改視覺元素。非常適合精準修圖、物件移除與紋理修改。

  • 高層次語意編輯:執行複雜的轉換,例如 IP 創作、物件旋轉、風格轉換以及視角變換,同時維持整張圖像的語意一致性。

最先進的效能表現

Qwen-Image-Edit 在多項公開基準測試中名列前茅,包括 GEdit、ImgEdit、GSO,以及 LongText-Bench、ChineseWord、TextCraft 等專門的文字渲染基準。該模型在中文文字生成方面尤為出色,以顯著優勢超越現有的最先進模型。

開源基礎

Qwen-Image-Edit 採用 Apache 2.0 授權釋出,代表著 AI 領域的重大轉變——以開源的彈性提供企業級的能力。它在 LMArena 上達到約 1182 Elo 分,是目前最頂尖的開放授權圖像編輯器。

應用場景

行銷與廣告

透過直接編輯宣傳素材上的文字來轉變你的創意工作流程,無需從零開始。需要更新產品名稱、變更定價,或是為中文市場進行行銷活動的在地化嗎?Qwen-Image-Edit 都能勝任,同時保持你的品牌視覺識別。

電商產品攝影

精確修改產品圖像——更換背景、調整光線、移除不需要的元素,或新增宣傳文字。模型保留未變動區域的能力意味著你的產品細節依然清晰準確。

內容在地化

對於同時經營英文與中文市場的企業而言,這個模型具有顛覆性。它能在保留原始字型風格的情況下翻譯並替換圖像中的文字——這在過去需要靠手動設計才能完成。

創意設計

探索風格轉換、物件操控與創意變形。無論是調整人物姿勢、改變視角,還是套用藝術風格,Qwen-Image-Edit 都能在實現劇烈視覺變化的同時,維持圖像的語意本質。

社群媒體內容

透過修改文字疊圖、更新日期與資訊,或是在不同情境下調整設計,快速迭代你的視覺內容——一切只需透過簡單的文字提示即可完成。

在 WaveSpeedAI 上開始使用

透過 WaveSpeedAI 存取 Qwen-Image-Edit,讓你能夠立即使用這款強大的模型,無需自行架設一套 200 億參數系統的複雜流程。

為什麼選擇 WaveSpeedAI?

  • 無冷啟動:透過我們始終預熱的推論基礎設施,你的請求可立即開始處理
  • 快速推論:經過最佳化的服務,即使是複雜的編輯任務也能快速回應
  • 平價定價:以可負擔的價格提供企業級 AI 能力
  • 簡單的 REST API:透過我們直觀易用的 API 無縫整合至現有工作流程

要開始使用,請造訪模型頁面 wavespeed.ai/models/wavespeed-ai/qwen-image/edit 並瀏覽相關文件。你可以在數分鐘內就讓正式生產環境的圖像編輯功能上線運行。

結語

Qwen-Image-Edit 代表著 AI 圖像編輯技術的重大躍進。它獨特地融合了雙語文字編輯、語意理解與外觀層級的精準度——並有最先進的基準測試表現作為佐證——使其成為跨足中英文市場的開發者、設計師、行銷人員與內容創作者不可或缺的工具。

該模型的開源 Apache 2.0 授權,讓過去只能透過封閉、昂貴平台才能取得的能力得以普及化。如今,透過 WaveSpeedAI 經過最佳化的推論平台,你可以在無需管理複雜基礎設施的情況下,駕馭這款 200 億參數的強大模型。

準備好轉變你的圖像編輯工作流程了嗎?立即在 WaveSpeedAI 上試用 Qwen-Image-Edit,體驗 AI 驅動視覺內容創作的未來。