← 博客

谷歌神秘的'Omni'视频模型:Gemini界面泄露在I/O 2026前告诉我们什么

谷歌似乎正在Gemini内部测试一款名为Omni的新视频生成模型,该消息通过一段在谷歌I/O 2026前被发现的界面字符串曝光。以下是我们已知的、未知的,以及它为何可能影响重大——包括对WaveSpeedAI上Veo的影响。

2 min read
谷歌神秘的'Omni'视频模型:Gemini界面泄露在I/O 2026前告诉我们什么

谷歌神秘的”Omni”视频模型:从 Gemini UI 泄露内容看 2026 年 I/O 大会前的信号

目前整个事件的全部证据只是一段 UI 字符串,但这段字符串的出现位置颇为耐人寻味。TestingCatalog 报道,从 Gemini 视频生成标签页截取的最新截图中出现了一行此前从未见过的文字:“从创意开始,或尝试模板。由 Omni 驱动。” Omni 就出现在”Toucan”旁边——后者是 Gemini 当前视频工具的内部代号,也就是目前由 Veo 3.1 驱动的那个功能。

距离 2026 年 Google I/O 大会开幕(5 月 19 日至 20 日)还有两周,这个传言着实难以忽视。以下是这次泄露所透露的信息、仍不明朗的细节,以及它在 2026 年视频生成竞争格局中的意义。

究竟发现了什么

唯一的证据是来自 Gemini 视频生成界面的一段 UI 占位文本。有两个细节让它不只是噪音:

  1. 该字符串对用户可见,而非仅仅埋藏在源码或功能开关中。提及品牌名称的 UI 文案能到达这一状态,通常意味着团队正在为公开发布做准备。
  2. 该字符串与”Toucan”并列出现——后者是谷歌在 Gemini 中基于 Veo 3.1 的现有视频生成路径的已知内部代号。新代码出现在旧代码旁边,一个新产品名称被置于现有产品名称旁边,正是交替上线前的标准预发布模式。

TestingCatalog 的 Threads 帖子对此总结道:“如果谷歌计划发布用于视频生成的 Gemini Omni,它很可能会超越 Veo 3.1。"

"Omni”究竟可能是什么

以下三种解读,按变革程度由低到高排列:

1. 新版 Veo 的外壳

影响最小的解释:Omni 是 Gemini 视频标签页的新产品名称,Veo 3.x 或 Veo 4 仍在后台负责实际生成工作。将品牌整合到单一的 Gemini 原生名称下(就像 Nano Banana 基于 Gemini 3 / 3.1 Flash Image 处理静态图像一样),可以解释为何一个面向公众的字符串会出现在这里。

2. 全新的 Gemini 训练视频模型

谷歌可能在 Gemini 体系下训练了一个内部视频模型,与 Veo 并列甚至取而代之。当前的分裂格局——Veo 负责视频、Nano Banana / Gemini 负责图像——足够别扭,足以让模型团队有动力将其统一。Omni 将是这一整合的产物,拥有独立于 Veo 3.1 的架构和评测表现。

3. 真正的全能模型——图像+视频+更多功能的统一系统

最大胆的解读,也是这个名字所暗示的:一个统一的 Gemini 全能模型,在同一系统内处理图像生成、视频生成,乃至音频,就像 GPT-4o 在文本-图像-音频领域的定位一样。若果真如此,Gemini 将成为首个具备视频输出能力的顶级全能模型——这将是一个重要的里程碑。

仅凭泄露的字符串无法区分以上三种情况。但只有第(3)种解读,才能为”Omni”这个全新的公开品牌名称提供充分理由——而不仅仅是升级 Veo 的版本号。

这对 2026 年视频生成竞争意味着什么

视频生成是当前生成式 AI 领域竞争最激烈的赛道。目前排行榜的大致格局如下:

  • 字节跳动 Seedance 2.0 在公开评测中位居榜首,FastTurbo 两个变体让电影级 AI 视频在高产量生产中具备了经济可行性。
  • 阿里巴巴 Wan 2.7 提供文本生成视频、图像生成视频、视频编辑和参考生成视频功能,支持 1080p 音频同步运动。
  • 快手 Kling V3.0(Std + Pro + O3)与 Wan 和 Seedance 共同引领亚洲厂商的浪潮。
  • OpenAI Sora 2 目前已广泛可用,并提供面向更高分辨率的 Pro 变体。
  • Google Veo 3.1 在电影级镜头运动和视听同步方面占据高地,但一直受到访问限制和地区封锁。

如果 Gemini Omni 发布后真的超越 Veo 3.1——这是 TestingCatalog 设定的基准——它将成为首个具备视频输出能力的顶级多模态统一模型,也将是谷歌首次选择以单一产品线名称参与竞争,而非延续 Veo / Imagen / Nano Banana 的分散格局。

何时揭晓

Google I/O 2026 将于 2026 年 5 月 19 日至 20 日举行,Gemini 和 AI 更新已确认列入议程。I/O 前夕 UI 泄露出现全新公开品牌名称的规律,与主题演讲阶段发布的节奏相吻合。

尽管如此,在谷歌官方公布之前,请将上述一切视为推测。UI 字符串此前也曾在没有产品发布的情况下上线。对这次泄露最有依据的解读是:谷歌有一款名为 Omni 的视频产品正处于 Gemini 上的晚期预发布阶段,最可能的发布窗口是接下来的两周。

这对 WaveSpeedAI 用户意味着什么

Veo 3.1 已在 WaveSpeedAI 上线,我们预计在任何新 Gemini 视频模型公开发布后不久即将其添加到平台——同样的单一 API 密钥、同样兼容 OpenAI 的 LLM 端点模式、同样的按秒计费。

如果 Omni 取代或补充 Veo 3.1,您将能够将其与我们已托管的其他视频生成模型进行 A/B 测试:

如果谷歌在 I/O 大会上发布 Omni,预计在发布后数日内即可通过同一 API 与其他模型进行对比测试。

常见问题

谷歌的”Omni”视频模型是什么?

根据在 Gemini 视频生成标签页中发现的 UI 字符串,Omni 似乎是一款新的谷歌视频生成模型或产品品牌,将取代或补充当前由 Veo 3.1 驱动的 Gemini 视频流程。目前尚无任何官方公告。

Omni 会取代 Veo 3.1 吗?

尚不明确。三种可能的解释:(1)Omni 是同一 Veo 驱动路径的新公开名称;(2)Omni 是与 Veo 并列的全新 Gemini 训练视频模型;(3)Omni 是在单一系统中处理图像和视频的统一 Gemini 全能模型。只有谷歌能够确认究竟是哪种情况。

谷歌何时会揭晓 Omni?

最可能的时间窗口是 2026 年 5 月 19 日至 20 日的 Google I/O 大会,谷歌已确认 Gemini 和 AI 更新将列入议程。

Omni 会超越 Seedance 2.0 吗?

字节跳动 Seedance 2.0 目前在大多数公开视频生成评测中名列前茅。Omni 能否实现超越,完全取决于其底层架构——而这目前尚不为外界所知。

Omni 会在 WaveSpeedAI 上线吗?

如果谷歌公开发布 Omni,它将在发布后不久被添加到 WaveSpeedAI 的模型目录,与现有的 Veo 3.1、Seedance 2.0、Wan 2.7、Kling V3.0 和 Sora 2 视频模型并列。

持续关注

距离 I/O 还有两周。谷歌一旦官方确认,我们将第一时间更新本文;与此同时,现有的 Veo 3.1 及其他视频生成模型已在 WaveSpeedAI 上线,通过统一 API 即可调用。

来源:TestingCatalog(网页文章Threads)。