谷歌神秘的'Omni'视频模型：Gemini界面泄露在I/O 2026前告诉我们什么

谷歌神秘的”Omni”视频模型：从 Gemini UI 泄露内容看 2026 年 I/O 大会前的信号

目前整个事件的全部证据只是一段 UI 字符串，但这段字符串的出现位置颇为耐人寻味。TestingCatalog 报道，从 Gemini 视频生成标签页截取的最新截图中出现了一行此前从未见过的文字：“从创意开始，或尝试模板。由 Omni 驱动。” Omni 就出现在”Toucan”旁边——后者是 Gemini 当前视频工具的内部代号，也就是目前由 Veo 3.1 驱动的那个功能。

距离 2026 年 Google I/O 大会开幕（5 月 19 日至 20 日）还有两周，这个传言着实难以忽视。以下是这次泄露所透露的信息、仍不明朗的细节，以及它在 2026 年视频生成竞争格局中的意义。

究竟发现了什么

唯一的证据是来自 Gemini 视频生成界面的一段 UI 占位文本。有两个细节让它不只是噪音：

该字符串对用户可见，而非仅仅埋藏在源码或功能开关中。提及品牌名称的 UI 文案能到达这一状态，通常意味着团队正在为公开发布做准备。
该字符串与”Toucan”并列出现——后者是谷歌在 Gemini 中基于 Veo 3.1 的现有视频生成路径的已知内部代号。新代码出现在旧代码旁边，一个新产品名称被置于现有产品名称旁边，正是交替上线前的标准预发布模式。

TestingCatalog 的 Threads 帖子对此总结道：“如果谷歌计划发布用于视频生成的 Gemini Omni，它很可能会超越 Veo 3.1。"

"Omni”究竟可能是什么

以下三种解读，按变革程度由低到高排列：

1. 新版 Veo 的外壳

影响最小的解释：Omni 是 Gemini 视频标签页的新产品名称，Veo 3.x 或 Veo 4 仍在后台负责实际生成工作。将品牌整合到单一的 Gemini 原生名称下（就像 Nano Banana 基于 Gemini 3 / 3.1 Flash Image 处理静态图像一样），可以解释为何一个面向公众的字符串会出现在这里。

2. 全新的 Gemini 训练视频模型

谷歌可能在 Gemini 体系下训练了一个内部视频模型，与 Veo 并列甚至取而代之。当前的分裂格局——Veo 负责视频、Nano Banana / Gemini 负责图像——足够别扭，足以让模型团队有动力将其统一。Omni 将是这一整合的产物，拥有独立于 Veo 3.1 的架构和评测表现。

3. 真正的全能模型——图像+视频+更多功能的统一系统

最大胆的解读，也是这个名字所暗示的：一个统一的 Gemini 全能模型，在同一系统内处理图像生成、视频生成，乃至音频，就像 GPT-4o 在文本-图像-音频领域的定位一样。若果真如此，Gemini 将成为首个具备视频输出能力的顶级全能模型——这将是一个重要的里程碑。

仅凭泄露的字符串无法区分以上三种情况。但只有第（3）种解读，才能为”Omni”这个全新的公开品牌名称提供充分理由——而不仅仅是升级 Veo 的版本号。

这对 2026 年视频生成竞争意味着什么

视频生成是当前生成式 AI 领域竞争最激烈的赛道。目前排行榜的大致格局如下：

字节跳动 Seedance 2.0 在公开评测中位居榜首，Fast 和 Turbo 两个变体让电影级 AI 视频在高产量生产中具备了经济可行性。
阿里巴巴 Wan 2.7 提供文本生成视频、图像生成视频、视频编辑和参考生成视频功能，支持 1080p 音频同步运动。
快手 Kling V3.0（Std + Pro + O3）与 Wan 和 Seedance 共同引领亚洲厂商的浪潮。
OpenAI Sora 2 目前已广泛可用，并提供面向更高分辨率的 Pro 变体。
Google Veo 3.1 在电影级镜头运动和视听同步方面占据高地，但一直受到访问限制和地区封锁。

如果 Gemini Omni 发布后真的超越 Veo 3.1——这是 TestingCatalog 设定的基准——它将成为首个具备视频输出能力的顶级多模态统一模型，也将是谷歌首次选择以单一产品线名称参与竞争，而非延续 Veo / Imagen / Nano Banana 的分散格局。

何时揭晓

Google I/O 2026 将于 2026 年 5 月 19 日至 20 日举行，Gemini 和 AI 更新已确认列入议程。I/O 前夕 UI 泄露出现全新公开品牌名称的规律，与主题演讲阶段发布的节奏相吻合。

尽管如此，在谷歌官方公布之前，请将上述一切视为推测。UI 字符串此前也曾在没有产品发布的情况下上线。对这次泄露最有依据的解读是：谷歌有一款名为 Omni 的视频产品正处于 Gemini 上的晚期预发布阶段，最可能的发布窗口是接下来的两周。

这对 WaveSpeedAI 用户意味着什么

Veo 3.1 已在 WaveSpeedAI 上线，我们预计在任何新 Gemini 视频模型公开发布后不久即将其添加到平台——同样的单一 API 密钥、同样兼容 OpenAI 的 LLM 端点模式、同样的按秒计费。

如果 Omni 取代或补充 Veo 3.1，您将能够将其与我们已托管的其他视频生成模型进行 A/B 测试：

Seedance 2.0 — 当前评测榜首
Wan 2.7 — 阿里巴巴电影级视频模型
Kling V3.0 Pro — 快手高保真选项
Sora 2 — OpenAI 的产品
Veo 3.1 — 谷歌当前视频模型

如果谷歌在 I/O 大会上发布 Omni，预计在发布后数日内即可通过同一 API 与其他模型进行对比测试。

常见问题

谷歌的”Omni”视频模型是什么？

根据在 Gemini 视频生成标签页中发现的 UI 字符串，Omni 似乎是一款新的谷歌视频生成模型或产品品牌，将取代或补充当前由 Veo 3.1 驱动的 Gemini 视频流程。目前尚无任何官方公告。

Omni 会取代 Veo 3.1 吗？

尚不明确。三种可能的解释：（1）Omni 是同一 Veo 驱动路径的新公开名称；（2）Omni 是与 Veo 并列的全新 Gemini 训练视频模型；（3）Omni 是在单一系统中处理图像和视频的统一 Gemini 全能模型。只有谷歌能够确认究竟是哪种情况。

谷歌何时会揭晓 Omni？

最可能的时间窗口是 2026 年 5 月 19 日至 20 日的 Google I/O 大会，谷歌已确认 Gemini 和 AI 更新将列入议程。

Omni 会超越 Seedance 2.0 吗？

字节跳动 Seedance 2.0 目前在大多数公开视频生成评测中名列前茅。Omni 能否实现超越，完全取决于其底层架构——而这目前尚不为外界所知。

Omni 会在 WaveSpeedAI 上线吗？

如果谷歌公开发布 Omni，它将在发布后不久被添加到 WaveSpeedAI 的模型目录，与现有的 Veo 3.1、Seedance 2.0、Wan 2.7、Kling V3.0 和 Sora 2 视频模型并列。

持续关注

距离 I/O 还有两周。谷歌一旦官方确认，我们将第一时间更新本文；与此同时，现有的 Veo 3.1 及其他视频生成模型已在 WaveSpeedAI 上线，通过统一 API 即可调用。

来源：TestingCatalog（网页文章，Threads）。

谷歌神秘的”Omni”视频模型：从 Gemini UI 泄露内容看 2026 年 I/O 大会前的信号

究竟发现了什么

"Omni”究竟可能是什么

1. 新版 Veo 的外壳

2. 全新的 Gemini 训练视频模型

3. 真正的全能模型——图像+视频+更多功能的统一系统

这对 2026 年视频生成竞争意味着什么

何时揭晓

这对 WaveSpeedAI 用户意味着什么

常见问题

谷歌的”Omni”视频模型是什么？

Omni 会取代 Veo 3.1 吗？

谷歌何时会揭晓 Omni？

Omni 会超越 Seedance 2.0 吗？

Omni 会在 WaveSpeedAI 上线吗？

持续关注

相关文章

Gemini Omni Flash vs Seedance 2.0 vs Kling 3.0：多模态创作最佳AI视频模型对比

Kling 3.0 Omni详解：多镜头分镜、原生音频及其超越Veo之处

Seedance 2.0 技术解析：为何音视频生成正成为默认标准

Agnes-Video-V2.0 以 $0.30/分钟登场：Artificial Analysis 排行榜上的价格颠覆者

Claude Sonnet 4.8：泄露内容究竟说了什么，以及为何这一模式不符合规律

Gemini 3.5 Flash正式发布——Flash级模型在智能体基准测试中领先Pro级