Google Nano Banana 2 Edit现已登陆WaveSpeedAI
Google Nano Banana 2 Edit(Gemini 3.1 Flash Image)支持高级图像编辑,具备4K输出能力、快速迭代和精准的指令跟随功能。
Google Nano Banana 2 Edit 正式登陆 WaveSpeedAI
Google 的 Nano Banana 2 已经到来——随之而来的,是迄今为止最强大的 AI 图像编辑模型之一。Nano Banana 2 Edit(基于 Gemini 3.1 Flash Image 驱动)将自然语言图像编辑提升到全新高度:描述你想要的修改,模型便能精准执行,具备上下文感知能力,输出分辨率最高可达 4K。
无论你需要替换背景、翻译图像中的文字、改变角色外观,还是应用全新的视觉风格,Nano Banana 2 Edit 都能通过简单的文本指令完成——无需蒙版、无需图层、无需手动选择工具。
在 WaveSpeedAI 上试用 Nano Banana 2 Edit
什么是 Nano Banana 2 Edit?
Nano Banana 2 Edit 是 Google 最新 Nano Banana 模型系列的图生图编辑变体。基于 Gemini 3.1 Flash 架构构建,它将 Nano Banana Pro 的视觉智能与质量,与 Google Flash 层级的速度相结合——正如 Google 所说,实现了”Flash 速度下的 Pro 级质量”。
与需要像素级操作的传统图像编辑器不同,Nano Banana 2 Edit 能够理解图像的语义内容。它知道什么是人物、什么是背景、什么是文字、什么是阴影。当你要求它”将背景改为日落海滩”时,它不只是简单地裁剪粘贴——它会调整光照方向、色温和反射,让编辑效果看起来自然真实。
在实际生产环境中,这种方式带来了显著的效率提升。早期采用者 HubX 报告称,在将 Gemini 3.1 Flash Image 集成到人脸编辑工作流后,延迟降低了 74-76%——编辑速度提升约 4 倍,同时不牺牲 Pro 级质量。
核心功能
自然语言编辑
用日常语言描述你的编辑需求。模型通过理解上下文、空间关系和视觉语义来执行复杂变换:
- “将男士西装颜色从海军蓝改为炭灰色”
- “将咖啡杯替换为一杯橙汁”
- “让场景看起来像黄金时段的光线”
- “在背景窗户上添加雨滴效果”
指令越具体,结果越精准。但即使是”让这张图看起来更专业”这样宽泛的指令,也能产生有意义的改善。
多图参考
上传最多 14 张参考图像,用于复杂编辑和合成。这支持以下工作流:
- 从参考照片进行风格迁移
- 在多个编辑输出中保持角色一致性
- 将多张源图像中的元素合成为一个连贯场景
Nano Banana 2 Edit 能保持参考对象的还原度,并在单个编辑工作流中对最多 5 个角色保持外貌一致性。
4K 输出分辨率
以 1K、2K 或 4K 分辨率生成编辑图像——涵盖从快速预览迭代到生产级成品的一切需求。先用 1K 快速实验,再将最佳结果以 4K 重新生成用于最终交付。
灵活的宽高比
支持 10 种宽高比输出:1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9 和 21:9。涵盖现代内容格式的全部范围——从方形社交帖子到超宽电影横幅。
图像内文字编辑与翻译
Nano Banana 2 Edit 的一大突出能力是对图像内文字的处理。模型可以:
- 修改现有文字,同时保留周围设计
- 在同一图像中将文字翻译为不同语言
- 编辑后保持字体风格、颜色和排版一致性
这历来是 AI 图像模型的薄弱环节,而 Nano Banana 2 在文字渲染精度上实现了代际飞跃。
内置提示词增强器
不确定如何描述编辑需求?内置提示词增强器会自动优化你的描述以获得更好的结果——将模糊的指令转化为精准的、模型优化的提示词。
实际应用场景
电商产品摄影
将基础产品照片转化为精致的目录图像。更换背景、调整光线、替换颜色,或将产品置于生活场景中——无需重新拍摄。单张产品照片可编辑为数十种变体,用于 A/B 测试或区域性营销活动。
营销与广告
快速迭代视觉方案。更改标题文字、替换模特外观、调整品牌颜色,或为不同市场本地化营销图像。文字翻译能力对全球营销活动尤为宝贵——可将主视觉图像中的英文文字编辑为日文、西班牙文或任何目标语言,同时保留设计风格。
规模化内容创作
社交媒体运营和内容团队可将单张基础图像转化为适配各平台的变体。调整宽高比、针对不同受众修改视觉元素,并在数十个编辑输出中保持品牌一致性。
角色与概念设计
游戏工作室和创意机构可利用多图参考编辑功能迭代角色设计——在各版本变体中更改服装、配饰、表情或环境,同时保持角色身份一致性。
照片修复与增强
将普通照片提升至专业品质。修复光线问题、去除干扰元素、改变天气条件,或调整户外照片的时间段。模型在提升整体质量的同时保留真实纹理。
在 WaveSpeedAI 上快速上手
通过 WaveSpeedAI 的 API 使用 Nano Banana 2 Edit 非常简单:
import wavespeed
output = wavespeed.run(
"google/nano-banana-2/edit",
{
"prompt": "将背景改为拥有落地玻璃窗的现代办公室",
"image": "https://example.com/portrait.jpg",
},
)
print(output["outputs"][0])
如需更高分辨率输出,添加 resolution 参数:
import wavespeed
output = wavespeed.run(
"google/nano-banana-2/edit",
{
"prompt": "将招牌上的文字替换为红色粗体的 'GRAND OPENING'",
"image": "https://example.com/storefront.jpg",
"resolution": "4k",
},
)
print(output["outputs"][0])
定价
Nano Banana 2 Edit 以 Flash 层级的价格提供 Pro 级编辑质量:
| 分辨率 | 每次编辑费用 |
|---|---|
| 1K | $0.08 |
| 2K | $0.12 |
| 4K | $0.16 |
在 WaveSpeedAI 上,生成时间在 4-6 秒范围内且无冷启动,以远低于人工编辑工作流的成本,提供快速、可预测的性能。
横向对比
Nano Banana 2 Edit 在 AI 编辑领域占据独特位置。与 Midjourney 或 DALL-E 等通用图像生成器相比,它提供了对编辑更精准的控制——在转换你指定内容的同时,保留图像中你希望保留的部分。与 Nano Banana Pro Edit 相比,它以更快的速度和更低的成本提供相当的质量。
| 功能 | Nano Banana 2 Edit | Nano Banana Pro Edit |
|---|---|---|
| 架构 | Gemini 3.1 Flash | Gemini 3 Pro |
| 最高分辨率 | 4K | 4K |
| 参考图像数量 | 最多 14 张 | 最多 14 张 |
| 速度 | 快速(4-6 秒) | 中等 |
| 文字编辑 | 高级 | 高级 |
| 费用(1K) | $0.08 | 更高 |
对于大多数编辑工作流,Nano Banana 2 Edit 是最优选择——在保持 Pro 级输出质量的同时,将成本和延迟控制在足够低的水平,适合高吞吐量的生产使用。
开始编辑
Nano Banana 2 Edit 让专业图像编辑变得像描述你的需求一样简单。无需手动蒙版、无需图层管理、无需设计技能——只需清晰的指令,模型处理其余一切。
- 在 WaveSpeedAI 注册并获取 API 密钥
- 安装 SDK:
pip install wavespeed - 使用
google/nano-banana-2/edit开始编辑





