← Blog

O Misterioso Modelo de Vídeo 'Omni' do Google: O Que o Vazamento da Interface do Gemini Nos Revela Antes do I/O 2026

O Google parece estar testando um novo modelo de geração de vídeo chamado Omni dentro do Gemini, revelado por uma string de interface descoberta antes do Google I/O 2026. Veja o que sabemos, o que ainda não sabemos e por que isso pode ser importante — inclusive para o Veo no WaveSpeedAI.

7 min read
O Misterioso Modelo de Vídeo 'Omni' do Google: O Que o Vazamento da Interface do Gemini Nos Revela Antes do I/O 2026

O Misterioso Modelo de Vídeo ‘Omni’ do Google: O Que o Vazamento da Interface do Gemini Nos Diz Antes do I/O 2026

Uma pequena string de interface é toda a história até agora, mas é uma string com um posicionamento muito interessante. O TestingCatalog reporta que uma nova captura de tela da aba de geração de vídeo do Gemini traz uma linha nunca antes vista: “Comece com uma ideia ou experimente um modelo. Desenvolvido por Omni.” O Omni aparece logo ao lado de “Toucan” — o nome interno da ferramenta de vídeo atual do Gemini, já alimentada pelo Veo 3.1.

Duas semanas antes da abertura do Google I/O 2026 (19–20 de maio), esse é um rumor difícil de ignorar. Veja o que o vazamento sugere, o que ainda é ambíguo e onde isso se encaixa na corrida maior de geração de vídeo em 2026.

O que foi realmente encontrado

A única evidência é um texto de espaço reservado na interface de geração de vídeo do Gemini. Dois detalhes fazem com que seja mais do que ruído:

  1. A string está visível para os usuários, não apenas enterrada no código-fonte ou em sinalizadores de funcionalidades. Textos de interface que mencionam um nome de marca geralmente chegam a esse estado apenas quando a equipe está se preparando para um lançamento público.
  2. O posicionamento é ao lado de “Toucan” — um codinome interno conhecido para o caminho atual de geração de vídeo no Gemini, alimentado pelo Veo 3.1. Novo código fica ao lado do código antigo. Um novo nome de produto estacionado ao lado de um existente é o padrão de preparação antes de uma troca.

O post do TestingCatalog no Threads resume: “Se o Google planeja lançar o Gemini Omni para geração de vídeo, ele provavelmente superará o Veo 3.1.”

O que “Omni” pode realmente ser

Três leituras, em ordem crescente de quão transformadoras seriam:

1. Um novo wrapper do Veo

A explicação menos disruptiva: Omni é o novo nome do produto para a aba de vídeo do Gemini, com o Veo 3.x ou Veo 4 ainda realizando o trabalho real de geração. A consolidação de marca sob um único nome nativo do Gemini (da forma como o Nano Banana está no Gemini 3 / 3.1 Flash Image para imagens estáticas) explicaria por que uma string voltada ao público está aparecendo.

2. Um novo modelo de vídeo treinado pelo Gemini

O Google pode ter treinado um modelo de vídeo interno sob o guarda-chuva do Gemini para ficar ao lado ou substituir o Veo. A divisão atual — Veo para vídeo, Nano Banana / Gemini para imagens — é suficientemente estranha para que a equipe de modelos tenha razões para unificá-la. Omni seria o resultado, com sua própria arquitetura e perfil de benchmark distintos do Veo 3.1.

3. Um verdadeiro modelo omni — sistema único para imagem + vídeo + mais

A leitura mais ambiciosa, e aquela que o nome sugere: um único modelo omni do Gemini que lida com geração de imagens, geração de vídeos e possivelmente áudio no mesmo sistema, da forma como o GPT-4o é posicionado para texto-imagem-áudio. Se verdadeiro, o Gemini seria o primeiro modelo omni de primeira linha com saída de vídeo — um marco significativo.

A string vazada não consegue distinguir entre essas possibilidades. Mas a opção (3) é a única que justifica um novo nome público como “Omni” em vez de simplesmente incrementar o número de versão do Veo.

Por que isso importa para a corrida de geração de vídeo em 2026

A geração de vídeo é a categoria mais competitiva em IA generativa no momento. O estado atual do ranking, aproximadamente:

  • ByteDance Seedance 2.0 está no topo dos benchmarks públicos, com as variantes Fast e Turbo tornando o vídeo de IA cinematográfico financeiramente viável para produção de alto volume.
  • Alibaba Wan 2.7 oferece texto para vídeo, imagem para vídeo, edição de vídeo e referência para vídeo com movimento sincronizado com áudio em 1080p.
  • Kuaishou Kling V3.0 (Std + Pro + O3) ancora a onda liderada pela Ásia ao lado do Wan e do Seedance.
  • OpenAI Sora 2 está amplamente disponível agora, com uma variante Pro para maior resolução.
  • Google Veo 3.1 mantém a vantagem para trabalhos cinematográficos de câmera e sincronização audiovisual, mas tem sido restrito e bloqueado por região.

Um lançamento do Gemini Omni que genuinamente supere o Veo 3.1 — o padrão que o TestingCatalog estabelece — seria o primeiro modelo unificado multimodal de primeira linha com saída de vídeo, e a primeira vez que o Google escolhe competir com uma linha de produto de nome único em vez de uma divisão Veo / Imagen / Nano Banana.

Quando esperar a revelação

O Google I/O 2026 acontece nos dias 19–20 de maio de 2026. Atualizações do Gemini e de IA são itens confirmados da agenda. Um padrão de vazamentos de interface pré-I/O apresentando um novo nome público é consistente com uma revelação no palco do keynote.

Dito isso, trate tudo isso como especulativo até que o Google o diga no palco. Strings de interface já foram lançadas sem lançamentos de produtos antes. A leitura mais defensável do vazamento é: O Google tem um produto de vídeo chamado Omni em estágio avançado de preparação no Gemini, e a janela mais plausível para um lançamento são as próximas duas semanas.

O que isso significaria para os usuários do WaveSpeedAI

O Veo 3.1 já está disponível no WaveSpeedAI, e esperamos adicionar qualquer novo modelo de vídeo do Gemini à plataforma logo após o lançamento público — mesma chave de API única, mesmo padrão de endpoint LLM compatível com OpenAI, mesmo preço por segundo.

Se o Omni substituir ou complementar o Veo 3.1, você poderá testá-lo em comparação com o restante da lineup de geração de vídeo que já hospedamos:

  • Seedance 2.0 — atual SOTA nos benchmarks
  • Wan 2.7 — modelo de vídeo cinematográfico da Alibaba
  • Kling V3.0 Pro — opção de alta fidelidade da Kuaishou
  • Sora 2 — oferta da OpenAI
  • Veo 3.1 — modelo de vídeo atual do Google

Se o Google lançar o Omni no I/O, espere compará-lo sob a mesma API nos dias após o lançamento.

Perguntas frequentes

O que é o modelo de vídeo “Omni” do Google?

Com base em uma string de interface encontrada na aba de geração de vídeo do Gemini, o Omni parece ser um novo modelo de geração de vídeo ou marca de produto do Google que substitui ou complementa o fluxo de vídeo atual do Gemini alimentado pelo Veo 3.1. Nada oficial foi anunciado.

O Omni substituirá o Veo 3.1?

Não está claro. Três interpretações plausíveis: (1) Omni é um novo nome público para o mesmo caminho alimentado pelo Veo; (2) Omni é um novo modelo de vídeo treinado pelo Gemini ao lado do Veo; (3) Omni é um modelo omni unificado do Gemini que lida com imagem e vídeo em um único sistema. Somente o Google pode confirmar qual delas.

Quando o Google revelará o Omni?

A janela mais provável é o Google I/O 2026 nos dias 19–20 de maio, onde o Google confirmou que atualizações do Gemini e de IA estão na agenda.

O Omni superará o Seedance 2.0?

O ByteDance Seedance 2.0 atualmente lidera a maioria dos benchmarks públicos de geração de vídeo. Se o Omni conseguirá ultrapassá-lo depende inteiramente do que está por baixo do capô — nada disso é conhecido ainda.

O Omni estará disponível no WaveSpeedAI?

Se o Google lançar o Omni publicamente, ele será adicionado ao catálogo de modelos do WaveSpeedAI logo em seguida, ao lado dos modelos de vídeo existentes Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0 e Sora 2.

Fique atento

Duas semanas até o I/O. Atualizaremos este post no dia em que o Google confirmar qualquer coisa; enquanto isso, o Veo 3.1 existente e o restante da lineup de geração de vídeo estão disponíveis no WaveSpeedAI sob uma única API.

Fonte: TestingCatalog (post web, Threads).

Compartilhar