El misterioso modelo de video 'Omni' de Google: qué nos revela la filtración de la interfaz de Gemini antes del I/O 2026
Google parece estar probando un nuevo modelo de generación de video llamado Omni dentro de Gemini, descubierto a través de una cadena de texto en la interfaz detectada antes del Google I/O 2026. Esto es lo que sabemos, lo que no sabemos y por qué podría importar, incluyendo para Veo en WaveSpeedAI.
El misterioso modelo de vídeo ‘Omni’ de Google: lo que la filtración de la UI de Gemini nos dice antes del I/O 2026
Una pequeña cadena de texto en la interfaz es toda la historia por ahora, pero es una cadena con una ubicación muy interesante. TestingCatalog informa que una nueva captura de pantalla de la pestaña de generación de vídeo de Gemini muestra una línea nunca antes vista: “Start with an idea or try a template. Powered by Omni.” Omni aparece justo al lado de “Toucan” — el nombre interno de la herramienta de vídeo actual de Gemini, la que ya está impulsada por Veo 3.1.
Dos semanas antes de que abra el Google I/O 2026 (19–20 de mayo), es un rumor difícil de ignorar. Esto es lo que sugiere la filtración, lo que sigue siendo ambiguo y dónde encaja esto en la mayor carrera de generación de vídeo en 2026.
Qué se detectó exactamente
La única pieza de evidencia es un texto de marcador de posición de la UI en la experiencia de generación de vídeo de Gemini. Dos detalles hacen que sea más que ruido:
- La cadena es visible para los usuarios, no está enterrada solo en el código fuente o en indicadores de características. El texto de la UI que menciona un nombre de marca típicamente llega a ese estado solo cuando el equipo se está preparando para un lanzamiento público.
- La ubicación es junto a “Toucan” — un nombre en clave interno conocido para la ruta actual de generación de vídeo respaldada por Veo 3.1 en Gemini. El código nuevo vive junto al código antiguo. Un nuevo nombre de producto estacionado junto a uno existente es el patrón de preparación estándar antes de un intercambio.
El post de TestingCatalog en Threads lo resume: “Si Google planea lanzar Gemini Omni para la generación de vídeo, probablemente superaría a Veo 3.1.”
Qué podría ser realmente “Omni”
Tres interpretaciones, en orden creciente de lo transformadoras que serían:
1. Un nuevo envoltorio de Veo
La explicación menos disruptiva: Omni es el nuevo nombre de producto para la pestaña de vídeo de Gemini, con Veo 3.x o Veo 4 haciendo el trabajo de generación real. La consolidación de marca bajo un único nombre nativo de Gemini (de la manera en que Nano Banana se asienta sobre Gemini 3 / 3.1 Flash Image para imágenes estáticas) explicaría por qué aparece una cadena orientada al público.
2. Un nuevo modelo de vídeo entrenado por Gemini
Google podría haber entrenado un modelo de vídeo interno bajo el paraguas de Gemini para acompañar o reemplazar a Veo. La división actual — Veo para vídeo, Nano Banana / Gemini para imágenes — es lo suficientemente incómoda como para que el equipo de modelos tenga razones para unificarla. Omni sería el resultado, con su propia arquitectura y perfil de benchmarks distinto de Veo 3.1.
3. Un verdadero modelo omni — un sistema único para imagen + vídeo + más
La lectura más ambiciosa, y la que el nombre sugiere: un único modelo omni de Gemini que maneja la generación de imágenes, la generación de vídeo y posiblemente audio en el mismo sistema, de la manera en que GPT-4o está posicionado para texto-imagen-audio. De ser cierto, Gemini sería el primer modelo omni de primer nivel con salida de vídeo — un primer logro significativo.
La cadena filtrada no puede distinguir entre estas opciones. Pero la opción (3) es la única que justifica un nombre público completamente nuevo como “Omni” en lugar de simplemente incrementar el número de versión de Veo.
Por qué esto importa para la carrera de generación de vídeo en 2026
La generación de vídeo es la categoría más competitiva en IA generativa ahora mismo. El estado actual del marcador, aproximadamente:
- ByteDance Seedance 2.0 está en la cima de los benchmarks públicos, con las variantes Fast y Turbo haciendo que el vídeo cinematográfico de IA sea financieramente viable para la producción de alto volumen.
- Alibaba Wan 2.7 ofrece texto a vídeo, imagen a vídeo, edición de vídeo y referencia a vídeo con movimiento sincronizado por audio a 1080p.
- Kuaishou Kling V3.0 (Std + Pro + O3) ancla la ola liderada por Asia junto a Wan y Seedance.
- OpenAI Sora 2 está ampliamente disponible ahora, con una variante Pro para mayor resolución.
- Google Veo 3.1 ocupa la posición alta para el trabajo de cámara cinematográfica y la sincronización audiovisual, pero ha estado restringido y bloqueado por región.
Un lanzamiento de Gemini Omni que genuinamente supere a Veo 3.1 — el listón que establece TestingCatalog — sería el primer modelo unificado multimodal de primer nivel con salida de vídeo, y la primera vez que Google elige competir con una línea de productos de nombre único en lugar de una división Veo / Imagen / Nano Banana.
Cuándo esperar la revelación
El Google I/O 2026 se celebra el 19–20 de mayo de 2026. Las actualizaciones de Gemini e IA son elementos confirmados en la agenda. Un patrón de filtraciones de UI previas al I/O que muestran un nombre público nuevo es consistente con una revelación en el discurso principal.
Dicho esto, trata todo esto como especulativo hasta que Google lo anuncie oficialmente. Las cadenas de UI se han lanzado sin lanzamientos de productos antes. La lectura más defendible de la filtración es: Google tiene un producto de vídeo llamado Omni en fase de preparación avanzada en Gemini, y la ventana más plausible para un lanzamiento son las próximas dos semanas.
Qué significaría esto para los usuarios de WaveSpeedAI
Veo 3.1 ya está disponible en WaveSpeedAI, y esperamos agregar cualquier nuevo modelo de vídeo de Gemini a la plataforma poco después del lanzamiento público — la misma clave API única, el mismo patrón de endpoint LLM compatible con OpenAI, el mismo precio por segundo.
Si Omni reemplaza o complementa a Veo 3.1, podrás hacer pruebas A/B comparándolo con el resto de la alineación de generación de vídeo que ya alojamos:
- Seedance 2.0 — SOTA actual en benchmarks
- Wan 2.7 — el modelo de vídeo cinematográfico de Alibaba
- Kling V3.0 Pro — la opción de alta fidelidad de Kuaishou
- Sora 2 — la oferta de OpenAI
- Veo 3.1 — el modelo de vídeo actual de Google
Si Google lanza Omni en el I/O, espera poder compararlo bajo la misma API en los días posteriores al lanzamiento.
Preguntas frecuentes
¿Qué es el modelo de vídeo “Omni” de Google?
Basándose en una cadena de UI detectada en la pestaña de generación de vídeo de Gemini, Omni parece ser un nuevo modelo o marca de producto de generación de vídeo de Google que reemplaza o complementa el flujo de vídeo de Gemini impulsado actualmente por Veo 3.1. No se ha anunciado nada oficial.
¿Omni reemplazará a Veo 3.1?
No está claro. Tres interpretaciones plausibles: (1) Omni es un nuevo nombre público para la misma ruta impulsada por Veo; (2) Omni es un nuevo modelo de vídeo entrenado por Gemini junto a Veo; (3) Omni es un modelo omni de Gemini unificado que maneja imagen y vídeo en un solo sistema. Solo Google puede confirmar cuál es.
¿Cuándo revelará Google Omni?
La ventana más probable es el Google I/O 2026 el 19–20 de mayo, donde Google ha confirmado que las actualizaciones de Gemini e IA están en la agenda.
¿Superará Omni a Seedance 2.0?
ByteDance Seedance 2.0 actualmente encabeza la mayoría de los benchmarks públicos de generación de vídeo. Si Omni puede superarlo depende completamente de lo que haya realmente bajo el capó — ninguno de lo cual se conoce todavía.
¿Estará Omni disponible en WaveSpeedAI?
Si Google lanza Omni públicamente, se agregará al catálogo de modelos de WaveSpeedAI poco después, junto a los modelos de vídeo existentes Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0 y Sora 2.
Estate atento
Dos semanas hasta el I/O. Actualizaremos esta publicación el día que Google confirme algo; mientras tanto, el Veo 3.1 existente y el resto de la alineación de generación de vídeo están disponibles en WaveSpeedAI bajo una sola API.
Fuente: TestingCatalog (artículo web, Threads).




