← 博客

Qwen Image 2.0 即将登陆WaveSpeedAI

阿里巴巴的Qwen Image 2.0——排名第一的统一图像生成与编辑模型——即将登陆WaveSpeedAI。以下是它带来的特性以及为何值得关注。

2 min read

Qwen Image 2.0 即将登陆 WaveSpeedAI

阿里巴巴最新的图像基础模型将文本生成图像与图像编辑统一到单一的 70 亿参数架构中——目前在 AI Arena 盲测人类评估排行榜上,在图像生成和图像编辑两项类别中均位居 第一

WaveSpeed 已托管完整的 Qwen Image 系列——Qwen-ImageQwen-Image-EditQwen-Image-Max 以及多个 LoRA 变体。Qwen Image 2.0 是下一步升级。


Qwen Image 2.0 的差异化优势

单一模型兼顾生成与编辑

此前的 Qwen Image 版本使用独立模型——一个用于文本生成图像,另一个用于编辑现有图像。Qwen Image 2.0 将两者合并为单一模型。生成图像后即可对其进行编辑,全程通过同一接口完成。

支持风格迁移、物体插入与删除、照片文字叠加、多图合成以及跨领域编辑(例如将插画角色置入真实照片中)。

原生 2K 分辨率

该模型原生生成最高 2048 x 2048 像素的图像——而非放大处理。皮肤毛孔、织物纹理和建筑细节均在生成过程中直接渲染,而非事后补充。

专业文字渲染

这是最核心的亮点功能。Qwen Image 2.0 可直接根据提示词渲染复杂的文字排版——PPT 幻灯片、信息图表、电影海报、日历、数据图表及漫画。支持最长 1,000 个 token 的提示词,能准确处理中英文文字,并能根据正确的透视关系将文字适配到不同表面。

更小更快

参数量为 70 亿,相比 v1 的 200 亿大幅缩减,体积缩小近 3 倍,同时在所有基准测试中均超越前代。其架构——由 80 亿参数的 Qwen3-VL 编码器驱动 70 亿参数的扩散解码器——专为高效推理而设计。


基准测试

基准测试Qwen Image 2.0GPT Image 1FLUX.1
DPG-Bench88.3285.1583.84
GenEval0.91
AI Arena ELO第一(生成)
AI Arena ELO第一(编辑)

AI Arena 采用盲测人类评估——评测者在不知晓模型来源的情况下对输出结果进行并排比较。Qwen Image 2.0 在两个类别中均位列第一。


为何选择 WaveSpeed

Qwen Image 2.0 在 WaveSpeed 上线后,您将获得:

  • 无冷启动 — 始终保持热推理状态
  • 快速生成 — 针对生产工作负载优化的服务
  • 简洁 API — 沿用您已熟悉的 wavespeed.run() 接口
  • 按图计费 — 无需订阅或管理 GPU

如果您已在 WaveSpeed 上使用 Qwen Image 模型,升级路径非常顺畅。相同的 SDK,相同的工作流,更强大的模型。


可构建的应用场景

营销与设计 — 直接通过提示词生成包含准确文字的演示幻灯片、信息图表和海报,草稿素材无需 Photoshop 二次处理。

内容流水线 — 单一模型处理完整的生成 → 编辑 → 迭代循环,无需串联独立工具分别完成生成、编辑和文字叠加。

多语言内容 — 在同一图像中准确渲染中英文文字,适用于双语营销、包装效果图和本地化创意素材。

产品摄影 — 原生 2K 输出配合精细细节,使生成图像更接近可直接用于生产的质量,无需额外的放大处理步骤。


敬请关注

Qwen Image 2.0 即将在 WaveSpeed 上线。请关注 wavespeed.ai 以获取上线公告。

与此同时,欢迎探索当前已在 WaveSpeed 上线的 Qwen Image 系列模型: