← 部落格

Google Nano Banana 2 Edit 現已登陸WaveSpeedAI

Google Nano Banana 2 Edit(Gemini 3.1 Flash Image)支援進階圖像編輯,具備4K輸出能力、快速迭代及精準指令跟隨。

3 min read
Google Nano Banana.2 Edit
Google Nano Banana.2 Edit Google Nano Banana 2 Edit(Gemini 3.1 Flash Image)支援進階圖像編輯,具備...
Try it
Google Nano Banana 2 Edit 現已登陸WaveSpeedAI

Google Nano Banana 2 Edit 現已登陸 WaveSpeedAI

Google 的 Nano Banana 2 正式登場——隨之而來的,是迄今為止功能最強大的 AI 圖像編輯模型之一。Nano Banana 2 Edit(由 Gemini 3.1 Flash Image 驅動)將自然語言圖像編輯提升至全新境界:只需描述您想要的變更,模型便能精準執行,具備情境感知能力,並支援高達 4K 的輸出解析度。

無論您需要替換背景、翻譯圖片中的文字、改變角色外觀,或套用全新視覺風格,Nano Banana 2 Edit 都能透過簡單的文字指令完成——無需遮罩、無需圖層、無需手動選取工具。

在 WaveSpeedAI 上試用 Nano Banana 2 Edit


什麼是 Nano Banana 2 Edit?

Nano Banana 2 Edit 是 Google 最新 Nano Banana 模型系列的圖像對圖像編輯變體。基於 Gemini 3.1 Flash 架構構建,它將 Nano Banana Pro 的視覺智能與品質,結合 Google Flash 層級的速度——實現 Google 所稱的「Flash 速度達 Pro 品質」。

與需要像素級操作的傳統圖像編輯器不同,Nano Banana 2 Edit 能夠理解圖像的語義內容。它能識別什麼是人物、什麼是背景、什麼是文字、什麼是陰影。當您要求「將背景更換為日落海灘」時,它不只是裁剪貼上——而是調整光線方向、色溫和反射,使編輯效果看起來自然。

在實際生產環境中,這種方法帶來了顯著的效率提升。早期採用者 HubX 在將 Gemini 3.1 Flash Image 整合至其人臉編輯工作流程後,回報延遲降低了 74-76%——在不犧牲 Pro 級品質的情況下,編輯速度提升了約 4 倍


主要功能

自然語言編輯

用日常語言描述您的編輯需求。模型會解析情境、空間關係和視覺語義,執行複雜的轉換:

  • 「將男士的西裝從深藍色改為炭灰色」
  • 「將咖啡杯替換為一杯柳橙汁」
  • 「讓場景呈現黃金時刻的光線效果」
  • 「在背景的窗戶上添加雨滴」

指令越具體,結果就越精準。但即使是「讓這個看起來更專業」這樣的寬泛指令,也能產生有意義的改善。

多圖像參考

上傳最多 14 張參考圖像,用於複雜的編輯和合成。這支援以下工作流程:

  • 從參考照片進行風格遷移
  • 在多個編輯輸出中保持角色一致性
  • 將多張來源圖像中的元素合成為一個連貫的場景

Nano Banana 2 Edit 能維持參考物件的保真度,並可在單一編輯工作流程中保留最多 5 個角色的相似性。

4K 輸出解析度

1K、2K 或 4K 解析度生成編輯後的圖像——涵蓋從快速預覽迭代到可直接用於生產的素材。從 1K 開始快速實驗,然後以 4K 重新生成最佳結果供最終交付。

彈性長寬比

以 10 種支援的長寬比輸出:1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9 和 21:9。涵蓋現代內容格式的完整範圍——從方形社群貼文到超寬電影橫幅。

圖片內文字編輯與翻譯

Nano Banana 2 Edit 的突出功能之一是其對圖像中文字的處理能力。模型能夠:

  • 在保留周圍設計的同時修改現有文字
  • 在同一圖像中將文字翻譯成不同語言
  • 在編輯後保持字體風格、顏色和版面的一致性

這向來是 AI 圖像模型的弱項,而 Nano Banana 2 在文字渲染精確度上代表了跨世代的飛躍。

內建提示詞增強器

不確定如何表達您的編輯需求?內建的提示詞增強器會自動優化您的描述以獲得更好的結果——將模糊的指令轉化為精確、針對模型優化的提示詞。


實際應用場景

電商產品攝影

將基本產品照片轉變為精緻的目錄圖像。更換背景、調整光線、替換顏色,或將產品置於生活情境中——所有操作都無需重拍。單張產品照片可編輯成數十種變體,用於 A/B 測試或區域行銷活動。

行銷與廣告

快速迭代視覺概念。更改標題文字、替換模特兒外觀、調整品牌色彩,或為不同市場本地化行銷圖像。文字翻譯功能對全球行銷活動尤其有價值——將主視覺圖像中的文字從英文編輯為日文、西班牙文或任何目標語言,同時保留設計風格。

大規模內容創作

社群媒體管理員和內容團隊可將單一基礎圖像轉換為適合各平台的版本。調整長寬比、為不同受眾修改視覺元素,並在數十個編輯輸出中保持品牌一致性。

角色與概念設計

遊戲工作室和創意機構可使用多圖像參考編輯來迭代角色設計——在多個變體中更改服裝、配件、表情或環境,同時保持角色身份的一致性。

照片修復與增強

將隨手拍的照片升級為專業品質。修復光線問題、移除干擾元素、更改天氣條件,或調整戶外拍攝的時段。模型在提升整體品質的同時保留真實紋理。


在 WaveSpeedAI 上開始使用

透過 WaveSpeedAI 的 API 使用 Nano Banana 2 Edit 非常簡單:

import wavespeed

output = wavespeed.run(
    "google/nano-banana-2/edit",
    {
        "prompt": "Change the background to a modern office with floor-to-ceiling windows",
        "image": "https://example.com/portrait.jpg",
    },
)

print(output["outputs"][0])

若需更高解析度的輸出,請加入 resolution 參數:

import wavespeed

output = wavespeed.run(
    "google/nano-banana-2/edit",
    {
        "prompt": "Replace the text on the sign with 'GRAND OPENING' in bold red letters",
        "image": "https://example.com/storefront.jpg",
        "resolution": "4k",
    },
)

print(output["outputs"][0])

定價

Nano Banana 2 Edit 以 Flash 層級的定價提供 Pro 級別的編輯品質:

解析度每次編輯費用
1K$0.08
2K$0.12
4K$0.16

生成時間在 4-6 秒範圍內,且在 WaveSpeedAI 上無冷啟動問題,您可以獲得快速、可預測的性能,費用僅為手動編輯工作流程的一小部分。


橫向比較

Nano Banana 2 Edit 在 AI 編輯領域佔據獨特地位。與 Midjourney 或 DALL-E 等通用圖像生成器相比,它對編輯提供了更精確的控制——保留您想保留的圖像部分,同時只轉換您指定的內容。與 Nano Banana Pro Edit 相比,它以更快的速度和更低的成本提供相當的品質。

功能Nano Banana 2 EditNano Banana Pro Edit
架構Gemini 3.1 FlashGemini 3 Pro
最大解析度4K4K
參考圖像最多 14 張最多 14 張
速度快速(4-6 秒)中等
文字編輯進階進階
費用(1K)$0.08更高

對於大多數編輯工作流程,Nano Banana 2 Edit 是最佳選擇——達到 Pro 級輸出品質的同時,將成本和延遲控制在足夠低的水準,適合大量生產使用。


開始編輯

Nano Banana 2 Edit 讓專業圖像編輯變得像描述需求一樣簡單。無需手動遮罩、無需圖層管理、無需設計技能——只需清晰的指令,模型負責其餘的一切。

  1. WaveSpeedAI 註冊並取得您的 API 金鑰
  2. 安裝 SDK:pip install wavespeed
  3. 使用 google/nano-banana-2/edit 開始編輯

立即在 WaveSpeedAI 上試用 Nano Banana 2 Edit →