Gemini 3.5 Pro Chega no Próximo Mês — O Que o Lançamento do Flash Já Nos Diz

O Google lançou o Gemini 3.5 Flash no I/O 2026 e reservou o Pro para junho. O Flash já supera o Gemini 3.1 Pro em benchmarks de programação e agentes, mas regrediu em raciocínio complexo — exatamente a lacuna que o Pro precisa preencher. Veja o que se sabe, o que ainda não se sabe e como se planejar.

By WaveSpeedAI 7 min read

No dia seguinte ao keynote do I/O 2026, a questão pré-keynote sobre se o Google lançaria o “Gemini 3.5” ou o “Gemini 4.0” foi respondida. É o 3.5. Mas a parte mais interessante é o que o Google de fato lançou e o que guardou: o Gemini 3.5 Flash foi disponibilizado para o público geral em 19 de maio; o Gemini 3.5 Pro está “chegando no próximo mês.” A frase exata de Sundar Pichai no palco: “Nos deem até o próximo mês para entregá-lo a vocês.”

A audiência, segundo relatos, gemia. Reação compreensível, mas a diferença também é mais interessante do que parece. O Flash já supera o Gemini 3.1 Pro nos benchmarks que mais importam para os desenvolvedores — e regride em um conjunto específico de benchmarks de raciocínio e contexto longo. O lançamento do Pro um mês depois é quase certamente a resposta do Google a essa regressão. Veja o que o lançamento do Flash nos diz sobre o que o Pro realmente será.

Confirmado: o que o Google disse sobre o 3.5 Pro

As declarações do Google no palco sobre o Pro foram mínimas. O conjunto completo de fatos confirmados:

DetalheFonteStatus
Lança “no próximo mês” (junho de 2026)Keynote de PichaiConfirmado
Atualmente em testes internosKeynote de PichaiConfirmado
Compartilhará o foco em codificação/agentes do FlashMensagens do I/OConfirmado
Números específicos de benchmarkNão divulgado
PrecificaçãoNão divulgado
Janela de contextoNão divulgado
ID do modeloNão divulgado

É isso. Sem benchmarks, sem preços, sem ficha técnica. O lançamento do Pro é exatamente uma declaração de intenção e um prazo.

O que os dados do Flash nos dizem sobre o Pro

É aqui que fica útil. O Gemini 3.5 Flash foi lançado no mesmo dia com benchmarks completos, e a comparação com o Gemini 3.1 Pro da geração anterior revela exatamente onde a nova geração é forte e onde é fraca.

Onde o Flash supera o Gemini 3.1 Pro

Benchmark3.5 Flash3.1 ProDelta
Terminal-Bench 2.176,2%70,3%+5,9
MCP Atlas83,6%78,2%+5,4
Finance Agent v257,9%43,0%+14,9
GDPval-AA1656 Elo1314 Elo+342

Todos são benchmarks de codificação e agentes — as categorias em que o Claude tem sido o padrão para desenvolvedores. O Flash agora está mais próximo do Claude nessas categorias do que o nível Pro anterior estava. Essa é uma mudança significativa de produto, não marginal.

Onde o Flash regride vs. Gemini 3.1 Pro

Benchmark3.5 Flash3.1 ProDelta
Humanity’s Last Exam40,2%44,4%−4,2
ARC-AGI-272,1%77,1%−5,0
Contexto longo (128K)77,3%84,9%−7,6

Esses três são exatamente os benchmarks onde você esperaria que um nível Pro se diferenciasse. Raciocínio profundo. Correspondência de padrões abstratos. Recuperação de contexto longo. Os dois primeiros testam profundidade; o terceiro testa a recuperação em escala. O Flash caindo 4 a 8 pontos em cada um indica que a arquitetura do Flash fez trade-offs deliberados para atingir os números de velocidade e custo.

O lançamento do 3.5 Pro em junho é quase certamente a resposta do Google a exatamente essa lista. A razão de existir do Pro é restaurar a vantagem de raciocínio e contexto longo que o Flash abdicou. Se o Pro ultrapassar o 3.1 Pro no Humanity’s Last Exam e igualar o Flash no Terminal-Bench, será o modelo frontier de produção mais forte. Se apenas corrigir a regressão ao custo da velocidade agêntica, será um posicionamento diferente.

O que a precificação do Flash implica para o Pro

O Flash foi lançado a $1,50 de entrada / $9,00 de saída por 1M de tokens no nível padrão — 40% mais barato que o Gemini 3.1 Pro em ambos os eixos. A entrada em cache é $0,15/1M, que é o número principal para cargas de trabalho com muita recuperação.

A leitura direta sobre a precificação do Pro:

  • Se o Pro for lançado com preços iguais ou superiores ao Gemini 3.1 Pro (~$2,50/$15/1M ou mais), está sinalizando que o Pro é destinado a ser um nível premium de raciocínio, e não um substituto do Flash.
  • Se o Pro for lançado abaixo do preço do 3.1 Pro, mas acima do Flash, está posicionado como o “Flash mais inteligente” padrão — mesma superfície de produto, maior capacidade, pequeno acréscimo.
  • Se o Pro igualar o preço do Flash, isso seria incomum e colocaria o Flash na mesma posição incômoda em que o Seedance 2.0 Fast se encontra atualmente (veja nossa prévia do Seedance 2.1 / Mini para o problema análogo de colisão de níveis).

A primeira opção é a mais provável. O Google está fazendo uma aposta estrutural de que os clientes pagarão pela separação em níveis de raciocínio. O gemido da audiência sugere que o mercado acha que o Flash é suficientemente bom e que o Pro é desnecessário; não saberemos se o mercado está certo até que os desenvolvedores rodem suas próprias avaliações contra a ficha técnica do modelo de junho.

Outras coisas a observar em junho

Quando a ficha técnica do modelo Pro for divulgada, quatro pontos específicos importam:

  1. O Pro iguala o Flash em codificação (Terminal-Bench, MCP Atlas)? Se sim, o Pro é um superconjunto estrito. Se não, você estará executando dois endpoints — Flash para agentes, Pro para raciocínio — e o custo de integração aumenta.
  2. Números de contexto longo. Se o Pro restaurar a vantagem do Gemini 3.1 Pro a 128K e estender para a mesma janela de contexto de 1M de tokens que o Flash oferece, esse é o sinal mais relevante para produção. Cargas de trabalho com RAG intensivo devem planejar sua migração especificamente com base nesse número.
  3. Alegações multimodais. O Flash foi lançado com o mesmo entendimento de imagem/vídeo da linha 3.0. Se o Pro for lançado com a integração de geração de vídeo Gemini Omni (ainda como rumor em 20 de maio), essa seria uma história de unificação que o Google ainda não pode contar.
  4. Se o Pro é um modelo de raciocínio. Os modelos de raciocínio recentes do Google foram lançados com modos de “pensamento” opcionais que trocam latência por precisão. Se o 3.5 Pro ativar o modo de pensamento por padrão ou expor controle por requisição, isso afeta materialmente como você o usaria em produção.

O que fazer este mês

Enquanto o Pro está em testes internos, três ações concretas:

  1. Execute suas avaliações no 3.5 Flash esta semana. Ele está disponível na Gemini API, no Google AI Studio, Vertex, Antigravity e no app Gemini sob o ID de modelo gemini-3.5-flash. Se o Flash já cobre sua carga de trabalho, talvez você não precise do Pro.
  2. Para cargas de trabalho de contexto longo ou raciocínio intenso, permaneça no Gemini 3.1 Pro por enquanto. Não migre para baixo para o Flash só porque é o modelo mais novo — a regressão de 7,6 pontos a 128K é real. Espere pelo Pro.
  3. Configure seu teste A/B de junho agora. Defina a avaliação comparativa Flash → Pro antes que o Pro seja lançado. A tentação de mudar no dia do lançamento é real; o valor de um benchmark reservado que você já rodou contra o Flash e o 3.1 Pro é ainda maior.

Até o Pro ser lançado

Para cargas de trabalho de LLM, o endpoint LLM da WaveSpeedAI oferece acesso compatível com OpenAI aos atuais modelos de texto frontier por uma única chave de API. Quando o Gemini 3.5 Pro chegar em junho, espere compará-lo nesse mesmo endpoint em poucos dias — ao lado do Flash e do restante do lineup de texto frontier.

Fontes: Resumo do I/O 2026 da MacRumors, LLM Stats sobre o Gemini 3.5 Flash, Análise do Gemini 3.5 pela Felloai, BusinessToday sobre Gemini Spark e 3.5.

Compartilhar