← 部落格

WaveSpeedAI Firered Image V1.1 Edit現已登陸WaveSpeedAI

FireRed Image Edit V1.1 支援自然語言指令進行精確圖像編輯,同時支援英文與中文提示詞,並可使用多張圖像作為參考

2 min read
Wavespeed Ai Firered Image V1.1 Edit
Wavespeed Ai Firered Image V1.1 Edit FireRed Image Edit V1.1 支援自然語言指令進行精確圖像編輯,同時支援英文與中文提示詞,並可使用多張...
Try it
WaveSpeedAI Firered Image V1.1 Edit現已登陸WaveSpeedAI

FireRed Image Edit V1.1 正式上線:增強身份一致性與多元素融合

WaveSpeedAI 非常高興地宣布 FireRed Image Edit V1.1 正式開放使用,這是小紅書備受好評的圖像編輯基礎模型的最新升級版本。在已經令人印象深刻的 V1.0 版本基礎上,新版本在身份一致性方面有了顯著提升,多圖像條件控制能力更加強大,並具備針對特定領域的專業編輯功能,讓 AI 驅動的圖像編輯比以往任何時候都更貼近現實世界的創意製作需求。

什麼是 FireRed Image Edit V1.1?

FireRed Image Edit V1.1 是一個基於擴散 Transformer 架構的圖像編輯模型,讓您可以使用自然語言指令對圖像進行轉換。上傳最多三張參考圖像,用中文或英文描述您想要的輸出結果,模型就會生成一張新圖像,智能地結合參考圖像中的元素、風格和人物。

V1.1 版本並非小幅修補——它在專業創意工作最關鍵的領域實現了實質性的飛躍。FireRed 團隊將優化工作聚焦於四個核心維度:人像一致性、多元素融合、風格化文字渲染,以及人像妝容效果。成果是一個在主要基準測試(Imgedit、Gedit 和 RedEdit)上保持頂尖開源性能的同時,在專業創作者日常遭遇的特定編輯場景中表現卓越的模型。

V1.1 的全新特性

業界頂尖的身份一致性

V1.1 最顯著的改進是人物身份保留。在編輯人像時——無論是更換背景、套用新風格,還是將人物合成到不同場景中——模型現在能以明顯更高的保真度保持面部特徵、表情和辨識特徵。這得益於一種可微分的一致性損失機制,能從預測圖像和真實圖像中提取感興趣區域,在整個生成過程中最小化身份差異。

對於從事角色驅動內容的創作者來說,這意味著您可以對人物進行重新風格化、重新擺姿勢和重新構圖,而不會出現困擾早期模型的身份漂移問題。

大規模多元素融合

V1.1 將多圖像合成提升至全新層次。雖然基礎模型支援最多三張直接參考圖像,但內建的 Agent 模組可透過自動 ROI 偵測、裁切和拼接實現10 個或更多元素的合成。以往需要精心設計提示詞並多次嘗試的複雜合成,現在只需直觀的描述就能可靠完成。

全面的人像妝容系統

V1.1 的一項全新特長是其人像妝容系統,提供數十種風格,涵蓋從專業美容修圖和膚色調整到創意及舞台造型等。這項功能對於需要在大量圖像中保持一致、高品質妝容效果的美妝品牌、內容創作者和編輯團隊尤為寶貴。

風格化文字參考

V1.1 引入了改進的文字風格渲染功能,支援專用 LoRA,實現高保真字體保留和風格化文字效果。無論您是要融入品牌文字元素,還是在編輯圖像中保留現有文字,模型都比前代版本處理得更加精準。

核心功能

  • 自然語言編輯:以中文或英文描述編輯需求,具備高精度的提示詞跟隨能力
  • 多圖像參考:上傳最多 3 張參考圖像,透過「圖 1」、「圖 2」等方式引用來結合元素
  • 風格感知生成:擅長雜誌風格、膠片顆粒、復古色調和電影美學
  • 靈活的輸出尺寸:選擇預設比例(1:1、16:9、9:16、4:3、3:4、3:2、2:3)或自訂 256 至 1,536 像素的尺寸
  • 內建提示詞增強器:自動優化您的描述以獲得更佳效果
  • 人物一致性:在轉換風格、場景或氛圍的同時保留人物身份
  • 照片修復:修復刮痕、增強褪色細節,並放大舊照片而不產生人工痕跡

實際應用場景

雜誌與時尚攝影

打造具有膠片顆粒、溫暖復古色調和經典雜誌美學的風格化人像。跨越不同場景、時代或氛圍轉換人物形象,同時保持其身份特徵不變——非常適合大規模製作型錄、宣傳圖像和社交媒體內容。

虛擬試穿與電商

將產品圖像與模特兒照片結合,生成逼真的合成圖,展示服裝、配飾或化妝品在不同人物身上的效果。V1.1 改進的身份一致性確保模特兒的外觀保持自然且易於辨識。

創意合成

將多張參考圖像中的元素融合成連貫的場景。結合一張照片中的人物、另一張照片中的背景,以及第三張照片中的風格參考——由 Agent 驅動的流程自動處理視覺融合。

美妝與化妝品

在產品攝影或網紅內容中一致地套用專業妝容風格。人像妝容系統能以一致的品質處理從細緻修圖到戲劇性創意造型的各種需求。

品牌與行銷內容

透過將品牌資產、產品和模特兒合成為精緻構圖,快速迭代宣傳視覺素材。無需返回攝影棚即可生成多種變體,節省時間和預算。

在 WaveSpeedAI 上快速開始

幾分鐘內即可開始使用 FireRed Image Edit V1.1:

  1. 前往模型頁面:訪問 wavespeed.ai/models/wavespeed-ai/firered-image-v1.1/edit
  2. 上傳參考圖像:添加最多 3 張圖像作為風格、人物或場景的參考
  3. 撰寫提示詞:描述期望的輸出結果,透過圖號引用圖像以實現精確控制
  4. 設定尺寸(可選):選擇預設比例、輸入自訂尺寸,或留空以保留原始比例
  5. 生成:提交並下載您編輯後的圖像

或直接透過 WaveSpeedAI API 整合:

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/firered-image-v1.1/edit",
    {
        "prompt": "Put the person from Figure 1 in a vintage film portrait style with warm retro tones and soft film grain",
        "images": [
            "https://example.com/portrait.jpg",
        ],
    },
)

print(output["outputs"][0])

每張圖像僅需 $0.08,FireRed Image Edit V1.1 以遠低於人工作業或傳統照片製作成本的價格提供專業級編輯效果。

為什麼選擇 WaveSpeedAI?

WaveSpeedAI 提供在生產環境中運行 FireRed Image Edit V1.1 最快速、最可靠的方式:

  • 無冷啟動:請求立即開始處理——無需預熱等待
  • 快速推理:優化的基礎設施在數秒內交付結果
  • 實惠定價:透明的按次計費,每張圖像僅需 $0.08
  • 生產就緒 API:無縫整合至您的應用程式和工作流程

立即使用 V1.1 開始編輯

FireRed Image Edit V1.1 提升了開源圖像編輯的標準——提供更強的身份保留能力、更強大的多元素融合功能,以及滿足專業創意工作流程需求的人像、妝容和文字編輯專業能力。無論您是在打造電商體驗、製作雜誌內容,還是自動化行銷視覺素材,V1.1 都能讓您以規模化的精準度和品質完成這一切。

立即在 WaveSpeedAI 上試用 FireRed Image Edit V1.1,訪問 wavespeed.ai/models/wavespeed-ai/firered-image-v1.1/edit——無需設定,無冷啟動,即刻存取頂尖圖像編輯功能。