Firered Image Edit现已登陆WaveSpeedAI
FireRed Image Edit 支持通过自然语言指令进行精准图像编辑,兼容中英文提示词,并支持多图参考。
隆重推出 FireRed Image Edit:最先进的自然语言图像编辑模型
WaveSpeedAI 非常高兴地宣布 FireRed Image Edit 正式上线——这是一款来自小红书 FireRed 团队的强大 AI 图像编辑模型,在多项编辑基准测试中均达到了业界领先水平。FireRed Image Edit 基于扩散变换器架构构建,将自然语言理解与多图合成能力相结合,让用户通过简单的文本指令即可实现精准、高保真的图像编辑。
什么是 FireRed Image Edit?
FireRed Image Edit 是一款通用图像编辑模型,在高达 16 亿样本的语料库上训练而成——其中包含 9 亿对文本-图像对和 7 亿对图像编辑对。经过严格的数据清洗和多阶段筛选后,超过 1 亿个高质量样本被保留下来,用于涵盖预训练、监督微调和强化学习的完整训练流程。
FireRed Image Edit 的独特之处在于其能够同时处理多张参考图像。无需单独编辑某张图片,你可以上传多张参考图——包含人物、物体、环境或风格——并描述如何将它们组合在一起。模型会智能地融合各元素,同时保持自然的构图、光照和透视关系。
该模型同时支持英文和中文提示词,对全球团队和中文工作流程同样高效适用。
核心功能
多图合成
FireRed Image Edit 最突出的能力是将多张参考图像中的元素合成为一张连贯的输出图像。上传一张人物照片和一张服装照片,然后指示模型将它们组合在一起。在提示词中通过编号引用图片——“将图1中的人物穿上图2中的服装”——从而精确控制各元素的位置关系。
自然语言精准控制
用普通的英文或中文描述你的编辑需求。从”将天空替换为日落”这样的简单修改,到”在保留图案的同时将裙子颜色改为红色”这样复杂的多步骤指令,FireRed Image Edit 都能以极高的准确率执行你的指令。该模型在标准化基准测试中的提示词遵循准确率约为 65.7%,跻身同类模型最优水平。
基准测试领先表现
FireRed Image Edit 已在各大主流编辑基准测试中确立了顶级表现:
- GEdit 基准:得分 7.92,超越包括 Qwen-Image-Edit 和 Seedream 4.0 在内的闭源竞争对手
- ImgEdit 基准:在开源模型中达到最先进水平
- REDEdit-Bench:在 15 个编辑类别中均取得领先成绩
在添加、调整、替换、移除、风格化和文字编辑等通用编辑维度上,FireRed Image Edit 在开源和商业系统中均持续排名前列。
智能融合
在对来自不同来源的元素进行合成时,模型会自动适配光照、透视和风格。这意味着你无需担心光线不匹配或合成效果生硬的问题——模型会自动处理视觉和谐化工作。
内置提示词增强器
不确定如何描述你的编辑需求?FireRed Image Edit 内置了提示词增强工具,能够自动优化你的描述以获得更好的效果,大幅降低获取高质量输出的门槛。
双语支持
原生支持英文和中文提示词,两种语言表现同样出色。这对于同时面向西方和中国市场的电商团队、营销机构和内容创作者尤为宝贵。
实际应用场景
虚拟试穿
上传一张人物照片和一张单独的服装照片,然后指示模型将它们合成。FireRed Image Edit 能够生成逼真的合成效果,展示服装穿在模特身上的样子,褶皱、阴影和身体贴合度均有准确呈现——非常适合时尚电商场景。
产品可视化
无需昂贵的拍摄,即可将产品置于不同环境或不同模特身上展示。将家具展示在各种房间场景中,展示手表佩戴在不同手腕上的效果,或在零售场景中预览包装设计。
角色合成
将角色特征与新环境、配件或姿势相结合。游戏开发者、动画师和概念设计师可以通过混合和匹配参考图像中的元素,快速制作角色设计原型。
营销与广告
通过将品牌资产——标志、产品、背景和模特——组合成精美构图,创建定制化的活动视觉素材。无需返回摄影棚,快速迭代多个版本。
老照片修复
除合成功能外,FireRed Image Edit 在修复和增强老照片方面同样出色,能够以高保真度和自然的视觉效果让褪色或受损的图像焕然一新。
风格迁移
将一张图像的视觉风格应用于另一张图像,同时保留内容和结构。将照片转换为绘画风格,应用电影级色彩分级,或统一一套营销素材的整体视觉风格。
在 WaveSpeedAI 上快速上手
在 WaveSpeedAI 上使用 FireRed Image Edit 只需几步:
- 访问模型页面:前往 wavespeed.ai/models/wavespeed-ai/firered-image-edit
- 上传参考图像:添加所有包含你想要组合元素的图像
- 编写提示词:使用”图1”、“图2”等描述编辑需求,引用特定图像
- 设置尺寸(可选):指定输出尺寸,或留空以匹配第一张图像的宽高比
- 生成:提交并下载编辑后的图像
你也可以直接通过 WaveSpeedAI API 集成:
import wavespeed
output = wavespeed.run(
"wavespeed-ai/firered-image-edit",
{
"prompt": "Put the person from Figure 1 in the outfit from Figure 2 in a modern office setting",
"images": [
"https://example.com/person.jpg",
"https://example.com/outfit.jpg",
],
},
)
print(output["outputs"][0])
每张图像仅需 $0.08,FireRed Image Edit 以远低于人工编辑或传统拍摄的成本,交付专业级别的编辑效果。
为什么选择 WaveSpeedAI?
WaveSpeedAI 提供了访问 FireRed Image Edit 生产环境最快、最可靠的方式:
- 零冷启动:请求立即开始处理,无需任何预热等待
- 快速推理:经过优化的基础设施在数秒内返回结果
- 实惠定价:透明的按需付费定价,无隐藏费用
- 生产就绪 API:无缝集成到你的应用程序和工作流程中
立即开始编辑
FireRed Image Edit 代表了指令式图像编辑的最前沿——将多图合成、双语自然语言理解和基准测试领先的质量集于一体。无论你是在构建虚拟试穿体验、自动化产品摄影,还是大规模创建营销视觉素材,FireRed Image Edit 都能提供你所需的精准度和品质。
立即在 WaveSpeedAI 上体验 FireRed Image Edit:wavespeed.ai/models/wavespeed-ai/firered-image-edit——无需配置,零冷启动,即刻访问最先进的图像编辑能力。





