Le mystérieux modèle vidéo 'Omni' de Google : ce que la fuite de l'interface Gemini nous révèle avant Google I/O 2026

Le Mystérieux Modèle Vidéo « Omni » de Google : Ce que la Fuite de l’Interface Gemini Nous Révèle Avant Google I/O 2026

Une simple chaîne de caractères dans une interface, voilà toute l’histoire pour l’instant — mais c’est une chaîne avec un emplacement très intéressant. TestingCatalog rapporte qu’une capture d’écran récente de l’onglet de génération vidéo de Gemini affiche une ligne inédite : « Start with an idea or try a template. Powered by Omni. » Omni apparaît juste à côté de « Toucan » — le nom interne de l’outil vidéo actuel de Gemini, celui qui fonctionne déjà avec Veo 3.1.

Deux semaines avant l’ouverture de Google I/O 2026 (19–20 mai), cette rumeur est difficile à ignorer. Voici ce que la fuite suggère, ce qui reste ambigu, et comment cela s’inscrit dans la course plus large à la génération vidéo en 2026.

Ce qui a été observé

La seule preuve disponible est un texte de substitution dans l’interface de génération vidéo de Gemini. Deux détails lui donnent plus qu’un simple bruit de fond :

La chaîne est visible par les utilisateurs, pas seulement enfouie dans le code source ou les indicateurs de fonctionnalités. Un texte d’interface mentionnant un nom de marque n’atteint généralement cet état que lorsque l’équipe se prépare à un lancement public.
L’emplacement est à côté de « Toucan » — un nom de code interne connu pour le pipeline de génération vidéo actuel de Google dans Gemini, alimenté par Veo 3.1. Le nouveau code voisine le vieux code. Un nouveau nom de produit placé à côté d’un existant correspond au schéma de staging standard avant un remplacement.

Le post Threads de TestingCatalog le résume ainsi : « Si Google prévoit de lancer Gemini Omni pour la génération vidéo, il surpasserait probablement Veo 3.1. »

Ce que « Omni » pourrait réellement être

Trois lectures, dans un ordre croissant de transformation potentielle :

1. Un nouveau wrapper Veo

L’explication la moins perturbatrice : Omni est le nouveau nom commercial de l’onglet vidéo de Gemini, avec Veo 3.x ou Veo 4 qui effectue toujours le travail de génération réel. Une consolidation de marque sous un nom natif Gemini unique (à la manière dont Nano Banana repose sur Gemini 3 / 3.1 Flash Image pour les images fixes) expliquerait pourquoi une chaîne visible du public fait son apparition.

2. Un nouveau modèle vidéo entraîné par Gemini

Google a peut-être entraîné un modèle vidéo interne sous le parapluie Gemini, destiné à côtoyer ou remplacer Veo. La séparation actuelle — Veo pour la vidéo, Nano Banana / Gemini pour les images — est suffisamment maladroite pour que l’équipe modèle ait des raisons de l’unifier. Omni serait le résultat, avec sa propre architecture et son propre profil de benchmark distinct de Veo 3.1.

3. Un véritable modèle omni — un système unique pour image + vidéo + plus

La lecture la plus ambitieuse, et celle que le nom suggère : un seul modèle omni Gemini gérant la génération d’images, de vidéos, et peut-être d’audio dans le même système, à la manière dont GPT-4o est positionné pour le texte-image-audio. Si cela est vrai, Gemini serait le premier modèle omni de premier rang avec une sortie vidéo — une première significative.

La chaîne divulguée ne permet pas de distinguer entre ces options. Mais l’option (3) est la seule qui justifie un nouveau nom public comme « Omni » plutôt que de simplement incrémenter le numéro de version de Veo.

Pourquoi cela compte dans la course à la génération vidéo en 2026

La génération vidéo est la catégorie la plus compétitive de l’IA générative en ce moment. L’état actuel du classement, grossièrement :

ByteDance Seedance 2.0 est en tête des benchmarks publics, avec les variantes Fast et Turbo rendant la vidéo IA cinématographique financièrement viable pour la production à grand volume.
Alibaba Wan 2.7 propose du texte-vers-vidéo, image-vers-vidéo, édition vidéo, et référence-vers-vidéo avec un mouvement synchronisé à l’audio en 1080p.
Kuaishou Kling V3.0 (Std + Pro + O3) ancre la vague menée par l’Asie aux côtés de Wan et Seedance.
OpenAI Sora 2 est largement disponible maintenant, avec une variante Pro pour une résolution plus élevée.
Google Veo 3.1 occupe la haute position pour le travail cinématographique et la synchronisation audio-visuelle, mais a été limité et soumis à des restrictions géographiques.

Une sortie de Gemini Omni qui surpasse véritablement Veo 3.1 — la barre fixée par TestingCatalog — serait le premier modèle unifié multi-modal de premier rang avec sortie vidéo, et la première fois que Google choisit de concurrencer sous une ligne de produit à nom unique plutôt que d’opérer une séparation Veo / Imagen / Nano Banana.

Quand attendre la révélation

Google I/O 2026 se déroule les 19–20 mai 2026. Les mises à jour Gemini et IA sont des points confirmés à l’ordre du jour. Un schéma de fuites d’interface avant I/O faisant apparaître un nouveau nom public est cohérent avec une révélation lors du discours principal.

Cela dit, traitez tout ceci comme spéculatif jusqu’à ce que Google le confirme sur scène. Des chaînes d’interface ont déjà été livrées sans lancement de produit. La lecture la plus défendable de la fuite est : Google dispose d’un produit vidéo appelé Omni en staging avancé sur Gemini, et la fenêtre la plus plausible pour un lancement est dans les deux prochaines semaines.

Ce que cela signifierait pour les utilisateurs de WaveSpeedAI

Veo 3.1 est déjà disponible sur WaveSpeedAI, et nous prévoyons d’ajouter tout nouveau modèle vidéo Gemini à la plateforme peu après sa sortie publique — même clé API unique, même schéma d’endpoint LLM compatible OpenAI, même tarification à la seconde.

Si Omni remplace ou complète Veo 3.1, vous pourrez le tester en A/B par rapport au reste de la gamme de génération vidéo que nous hébergeons déjà :

Seedance 2.0 — SOTA actuel sur les benchmarks
Wan 2.7 — Le modèle vidéo cinématographique d’Alibaba
Kling V3.0 Pro — L’option haute-fidélité de Kuaishou
Sora 2 — L’offre d’OpenAI
Veo 3.1 — Le modèle vidéo actuel de Google

Si Google lance Omni à I/O, attendez-vous à le comparer sous la même API dans les jours suivant le lancement.

Questions fréquemment posées

Qu’est-ce que le modèle vidéo « Omni » de Google ?

D’après une chaîne d’interface repérée dans l’onglet de génération vidéo de Gemini, Omni semble être un nouveau modèle de génération vidéo ou une marque produit de Google qui remplace ou complète le flux vidéo Gemini actuel alimenté par Veo 3.1. Rien d’officiel n’a été annoncé.

Omni remplacera-t-il Veo 3.1 ?

Incertain. Trois interprétations plausibles : (1) Omni est un nouveau nom public pour le même pipeline alimenté par Veo ; (2) Omni est un nouveau modèle vidéo entraîné par Gemini aux côtés de Veo ; (3) Omni est un modèle omni Gemini unifié gérant images et vidéos dans un seul système. Seul Google peut confirmer lequel.

Quand Google révélera-t-il Omni ?

La fenêtre la plus probable est Google I/O 2026 les 19–20 mai, où Google a confirmé que les mises à jour Gemini et IA figurent à l’ordre du jour.

Omni surpassera-t-il Seedance 2.0 ?

ByteDance Seedance 2.0 domine actuellement la plupart des benchmarks publics de génération vidéo. La capacité d’Omni à le dépasser dépend entièrement de ce qui se trouve réellement sous le capot — rien de tout cela n’est encore connu.

Omni sera-t-il disponible sur WaveSpeedAI ?

Si Google lance Omni publiquement, il sera ajouté au catalogue de modèles WaveSpeedAI peu après, aux côtés des modèles vidéo existants Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0, et Sora 2.

À suivre

Deux semaines avant I/O. Nous mettrons à jour cet article le jour où Google confirme quoi que ce soit ; en attendant, Veo 3.1 et le reste de la gamme de génération vidéo sont disponibles sur WaveSpeedAI sous une seule API.

Source : TestingCatalog (article web, Threads).