← 部落格

Google神秘的「Omni」影片模型:Gemini UI洩露在I/O 2026前透露了什麼

Google似乎正在Gemini內部測試一個名為Omni的新影片生成模型,這一消息來自Google I/O 2026前夕發現的UI字串。以下是我們目前所知的、尚不清楚的,以及它可能帶來的影響——包括對WaveSpeedAI上的Veo。

2 min read
Google神秘的「Omni」影片模型:Gemini UI洩露在I/O 2026前透露了什麼

Google 神秘的「Omni」影片模型:Gemini UI 洩露告訴我們什麼——2026 I/O 前瞻

目前為止,整件事就只有一個 UI 字串,但這個字串的出現位置十分耐人尋味。TestingCatalog 報導,一張來自 Gemini 影片生成頁籤的最新截圖中出現了一行前所未見的文字:「Start with an idea or try a template. Powered by Omni.」 Omni 就緊鄰在「Toucan」旁邊——Toucan 是 Gemini 現行影片工具的內部代號,也就是目前由 Veo 3.1 驅動的那個工具。

距離 Google I/O 2026 開幕(5 月 19 至 20 日)僅剩兩週,這個謠言實在難以忽視。以下是這次洩露所透露的訊息、仍不明朗的部分,以及它在 2026 年影片生成競賽大局中的定位。

究竟發現了什麼

唯一的證據是 Gemini 影片生成介面中的一段 UI 佔位文字。以下兩個細節讓它不只是雜訊:

  1. 這段文字對使用者可見,並非僅埋藏在原始碼或功能旗標之中。提及品牌名稱的 UI 文案能進展到這個狀態,通常代表團隊已在準備公開發布。
  2. 它緊鄰「Toucan」出現——Toucan 是 Google 目前在 Gemini 中以 Veo 3.1 驅動的影片生成路徑的已知內部代號。新程式碼往往與舊程式碼並列存在。一個新產品名稱停放在現有產品旁邊,正是替換前的標準預備模式。

TestingCatalog 的 Threads 貼文如此總結:「如果 Google 計劃為影片生成推出 Gemini Omni,它很可能會超越 Veo 3.1。」

「Omni」究竟可能是什麼

以下三種解讀,從影響程度最小到最具變革性排列:

1. 全新的 Veo 包裝

最不具顛覆性的解釋:Omni 是 Gemini 影片頁籤的新產品名稱,底層仍由 Veo 3.x 或 Veo 4 負責實際生成工作。統一到單一 Gemini 原生品牌名稱(就像 Nano Banana 建立在 Gemini 3 / 3.1 Flash Image 靜態圖片功能之上),可以解釋為何面向使用者的字串會率先出現。

2. 全新的 Gemini 自訓影片模型

Google 可能在 Gemini 旗下訓練了一個內部影片模型,用以與 Veo 並列或取而代之。目前的分裂格局——Veo 負責影片,Nano Banana / Gemini 負責圖片——已足夠尷尬,足以讓模型團隊有動機將其統一。Omni 就會是這個統一的成果,擁有獨立於 Veo 3.1 的架構與基準測試成績。

3. 真正的全模態模型——圖片、影片及更多功能一體整合

最雄心勃勃的解讀,也是這個名稱所暗示的:一個統一的 Gemini 全模態模型,在同一系統中處理圖片生成、影片生成,乃至音訊——就像 GPT-4o 在文字、圖片、音訊領域的定位一樣。若此屬實,Gemini 將成為首個具備影片輸出能力的頂尖全模態模型——這是一個意義重大的里程碑。

洩露的字串無法區分這三種可能性。但選項(3)是唯一能說明為何需要一個全新公開名稱「Omni」,而非僅是將 Veo 版本號碼往上疊加的理由。

為何這對 2026 年影片生成競賽至關重要

影片生成是目前生成式 AI 中競爭最激烈的類別。大致上,現行排行榜如下:

  • ByteDance Seedance 2.0 位居公開基準測試榜首,FastTurbo 變體讓高產量的電影級 AI 影片在財務上切實可行。
  • 阿里巴巴 Wan 2.7 提供文字轉影片、圖片轉影片、影片編輯,以及在 1080p 下支援音訊同步動態的參考圖轉影片功能。
  • 快手 Kling V3.0(Std + Pro + O3)與 Wan 及 Seedance 共同引領亞洲浪潮。
  • OpenAI Sora 2 現已廣泛開放,Pro 版提供更高解析度。
  • Google Veo 3.1 在電影級攝影機運動與視聽同步方面佔據高地,但受到存取限制與地區鎖定。

如果 Gemini Omni 的發布確實能超越 Veo 3.1——這是 TestingCatalog 設定的門檻——它將成為首個具備影片輸出能力的頂尖多模態統一模型,也是 Google 首次選擇以單一品牌產品線競爭,而非沿用 Veo / Imagen / Nano Banana 各自分立的策略。

何時揭曉

Google I/O 2026 將於 2026 年 5 月 19 至 20 日舉行,Gemini 及 AI 更新已確認列入議程。I/O 前 UI 洩露首現新公開名稱的模式,與主題演講現場揭幕的情境相符。

話雖如此,在 Google 正式宣布前,一切仍屬推測。UI 字串在過去也曾出現而產品未能如期發布。對這次洩露最站得住腳的解讀是:Google 有一個名為 Omni 的影片產品正在 Gemini 上進行後期預備,而最有可能的發布窗口就是接下來兩週。

這對 WaveSpeedAI 使用者意味著什麼

Veo 3.1 已在 WaveSpeedAI 上提供,我們預計在任何新 Gemini 影片模型公開發布後不久即將其加入平台——同一組 API 金鑰、同樣相容 OpenAI 的 LLM 端點模式、同樣的按秒計費定價。

如果 Omni 取代或補充 Veo 3.1,你將能夠將其與我們已托管的其他影片生成模型進行 A/B 測試:

如果 Google 在 I/O 發布 Omni,預計可在發布後數日內透過相同 API 進行比較。

常見問題

Google 的「Omni」影片模型是什麼?

根據在 Gemini 影片生成頁籤中發現的 UI 字串,Omni 似乎是一個新的 Google 影片生成模型或產品品牌,用於取代或補充現行由 Veo 3.1 驅動的 Gemini 影片流程。目前官方尚未發布任何公告。

Omni 會取代 Veo 3.1 嗎?

尚不明朗。有三種合理的解讀:(1)Omni 是相同 Veo 驅動路徑的新公開名稱;(2)Omni 是與 Veo 並列的新 Gemini 自訓影片模型;(3)Omni 是在同一系統中處理圖片與影片的統一 Gemini 全模態模型。唯有 Google 能確認究竟是哪一種。

Google 何時會揭露 Omni?

最有可能的窗口是 2026 年 5 月 19 至 20 日的 Google I/O,Google 已確認 Gemini 及 AI 更新列入議程。

Omni 會超越 Seedance 2.0 嗎?

ByteDance Seedance 2.0 目前在大多數公開影片生成基準測試中位居榜首。Omni 能否超越,完全取決於其底層架構——而這目前無人得知。

WaveSpeedAI 上會提供 Omni 嗎?

如果 Google 公開發布 Omni,它將在之後不久加入 WaveSpeedAI 的模型目錄,與現有的 Veo 3.1、Seedance 2.0、Wan 2.7、Kling V3.0 及 Sora 2 影片模型並列。

持續關注

距 I/O 還有兩週。Google 一旦確認任何消息,我們將於當日更新本文;與此同時,現有的 Veo 3.1 及其他影片生成模型已在 WaveSpeedAI 上線,透過同一組 API 即可存取。

資料來源:TestingCatalog(網站文章Threads)。