WaveSpeedAI Firered Image V1.1 Edit现已登陆WaveSpeedAI
FireRed Image Edit V1.1支持通过自然语言指令进行精准图像编辑,兼容中英文提示词,并支持多图参考。
FireRed Image Edit V1.1 正式上线:增强身份一致性与多元素融合
WaveSpeedAI 非常高兴地宣布 FireRed Image Edit V1.1 现已正式上线,这是小红书广受好评的图像编辑基础模型的最新升级版本。在已经令人印象深刻的 V1.0 版本基础上,新版本在身份一致性方面有了显著提升,提供了更强大的多图像条件控制,以及面向特定领域的编辑能力,使 AI 驱动的图像编辑比以往任何时候都更接近现实创意生产需求。
什么是 FireRed Image Edit V1.1?
FireRed Image Edit V1.1 是一款基于扩散变换器的图像编辑模型,让您可以通过自然语言指令对图像进行变换。上传最多三张参考图像,用中文或英文描述您想要的输出结果,模型便会生成一张新图像,智能地融合参考图中的元素、风格和人物。
V1.1 版本并非小幅修补——它在专业创意工作最关键的领域实现了质的飞跃。FireRed 团队将优化重点聚焦于四个核心维度:人像一致性、多元素融合、风格化文字渲染以及人像美妆效果。最终打造出一款在主要基准测试(Imgedit、Gedit 和 RedEdit)上保持开源领先水平的同时,在专业创作者日常遇到的专项编辑场景中同样表现卓越的模型。
V1.1 版本新特性
业界领先的身份一致性
V1.1 最重要的改进是人物身份保留能力。在编辑人像时——无论是更换背景、应用新风格,还是将主体合成到不同场景——模型现在能以显著更高的保真度保持面部特征、表情和独特特征。这一能力由可微分一致性损失机制驱动,该机制从预测图像和真实图像中提取感兴趣区域,在生成过程中最大程度地减少身份偏差。
对于从事角色驱动内容创作的创作者而言,这意味着您可以对主体进行重新风格化、重新摆姿,以及重新合成,而不会出现早期模型中常见的身份漂移问题。
大规模多元素融合
V1.1 将多图像合成提升到了新的高度。基础模型支持最多三张直接参考图像,而内置的 Agent 模块通过自动 ROI 检测、裁剪和拼接,可实现 10 个或更多元素的合成。以前需要精心设计提示词并多次尝试的复杂合成,现在只需简单描述便能稳定实现。
全面的人像美妆功能
V1.1 的一项新特色是人像美妆系统,提供数十种风格,从专业美容修图和肤色优化,到创意妆容和舞台造型,应有尽有。这一功能对于需要在大量图像上保持一致、高质量妆容效果的美妆品牌、内容创作者和编辑团队尤具价值。
风格化文字参考
V1.1 引入了改进的文字风格渲染,配备专用 LoRA 支持,实现高保真度排版保留和风格化文字效果。无论是融入品牌文字元素,还是在编辑后的图像中保留现有文字,模型处理精度都比前代版本更高。
核心功能
- 自然语言编辑:用中文或英文描述编辑需求,提示词跟随精度高
- 多图像参考:上传最多 3 张参考图像,通过”图 1”、“图 2”等引用方式组合元素
- 风格感知生成:擅长编辑风格、胶片颗粒、复古色调和电影美学
- 灵活输出尺寸:选择预设宽高比(1:1、16:9、9:16、4:3、3:4、3:2、2:3)或自定义 256 至 1536 像素的尺寸
- 内置提示词增强器:自动优化您的描述以获得更好的结果
- 人物一致性:在变换风格、场景或情绪的同时保留主体身份
- 照片修复:修复划痕、增强褪色细节,并在无人工痕迹的情况下放大老照片
实际应用场景
时尚编辑摄影
创作带有胶片颗粒、温暖复古色调和经典编辑美学的风格化人像。在不同场景、年代或情绪之间变换主体,同时保持其身份完整——非常适合大规模的品牌手册、广告形象和社交媒体内容。
虚拟试穿与电商
将产品图像与模特照片相结合,生成逼真的合成图,展示服装、配饰或化妆品在不同主体上的效果。V1.1 改进的身份一致性确保模特外观保持自然和可识别性。
创意合成
将多张参考图像中的元素融合成连贯的场景。将一张照片中的人物、另一张照片中的背景与第三张照片中的风格参考相结合——由 Agent 驱动的流水线自动处理视觉协调工作。
美妆与化妆品
在产品摄影或网红内容中一致地应用专业妆容风格。人像美妆系统以稳定的质量处理从精细修图到大胆创意妆容的各种需求。
品牌与营销内容
通过将品牌资产、产品和模特组合成精致的合成图,快速迭代广告视觉。无需返回摄影棚即可生成多个变体,节省时间和预算。
在 WaveSpeedAI 上快速上手
几分钟内即可开始使用 FireRed Image Edit V1.1:
- 访问模型页面:前往 wavespeed.ai/models/wavespeed-ai/firered-image-v1.1/edit
- 上传参考图像:添加最多 3 张图像用于风格、人物或场景引导
- 编写提示词:描述期望的输出结果,通过图号引用图像以实现精确控制
- 设置尺寸(可选):选择预设宽高比、输入自定义尺寸,或留空以保留原始比例
- 生成:提交并下载您编辑后的图像
或通过 WaveSpeedAI API 直接集成:
import wavespeed
output = wavespeed.run(
"wavespeed-ai/firered-image-v1.1/edit",
{
"prompt": "Put the person from Figure 1 in a vintage film portrait style with warm retro tones and soft film grain",
"images": [
"https://example.com/portrait.jpg",
],
},
)
print(output["outputs"][0])
仅需 每张图像 $0.08,FireRed Image Edit V1.1 以极低的成本提供专业级编辑效果,远低于手工操作或传统图片制作的费用。
为什么选择 WaveSpeedAI?
WaveSpeedAI 提供在生产环境中运行 FireRed Image Edit V1.1 最快速、最可靠的方式:
- 无冷启动:请求立即开始处理——无需预热等待
- 快速推理:优化基础设施在数秒内交付结果
- 实惠定价:透明的按量付费定价,每张图像 $0.08
- 生产就绪 API:无缝集成到您的应用程序和工作流程中
立即开始使用 V1.1
FireRed Image Edit V1.1 为开源图像编辑树立了新标杆——提供更强的身份保留能力、更强大的多元素融合,以及满足专业创意工作流需求的人像、美妆和文字编辑专项功能。无论您是在构建电商体验、制作编辑内容,还是自动化营销视觉,V1.1 都能为您提供大规模精准输出所需的精度和质量。
立即在 WaveSpeedAI 上试用 FireRed Image Edit V1.1,访问 wavespeed.ai/models/wavespeed-ai/firered-image-v1.1/edit——无需任何配置,无冷启动,即刻享受顶尖图像编辑能力。





