Gemini 3.5 Pro Chega no Próximo Mês — O Que o Lançamento do Flash Já Nos Diz
O Google lançou o Gemini 3.5 Flash no I/O 2026 e reservou o Pro para junho. O Flash já supera o Gemini 3.1 Pro em benchmarks de programação e agentes, mas regrediu em raciocínio complexo — exatamente a lacuna que o Pro precisa preencher. Veja o que se sabe, o que ainda não se sabe e como se planejar.
No dia seguinte ao keynote do I/O 2026, a questão pré-keynote sobre se o Google lançaria o “Gemini 3.5” ou o “Gemini 4.0” foi respondida. É o 3.5. Mas a parte mais interessante é o que o Google de fato lançou e o que guardou: o Gemini 3.5 Flash foi disponibilizado para o público geral em 19 de maio; o Gemini 3.5 Pro está “chegando no próximo mês.” A frase exata de Sundar Pichai no palco: “Nos deem até o próximo mês para entregá-lo a vocês.”
A audiência, segundo relatos, gemia. Reação compreensível, mas a diferença também é mais interessante do que parece. O Flash já supera o Gemini 3.1 Pro nos benchmarks que mais importam para os desenvolvedores — e regride em um conjunto específico de benchmarks de raciocínio e contexto longo. O lançamento do Pro um mês depois é quase certamente a resposta do Google a essa regressão. Veja o que o lançamento do Flash nos diz sobre o que o Pro realmente será.
Confirmado: o que o Google disse sobre o 3.5 Pro
As declarações do Google no palco sobre o Pro foram mínimas. O conjunto completo de fatos confirmados:
| Detalhe | Fonte | Status |
|---|---|---|
| Lança “no próximo mês” (junho de 2026) | Keynote de Pichai | Confirmado |
| Atualmente em testes internos | Keynote de Pichai | Confirmado |
| Compartilhará o foco em codificação/agentes do Flash | Mensagens do I/O | Confirmado |
| Números específicos de benchmark | — | Não divulgado |
| Precificação | — | Não divulgado |
| Janela de contexto | — | Não divulgado |
| ID do modelo | — | Não divulgado |
É isso. Sem benchmarks, sem preços, sem ficha técnica. O lançamento do Pro é exatamente uma declaração de intenção e um prazo.
O que os dados do Flash nos dizem sobre o Pro
É aqui que fica útil. O Gemini 3.5 Flash foi lançado no mesmo dia com benchmarks completos, e a comparação com o Gemini 3.1 Pro da geração anterior revela exatamente onde a nova geração é forte e onde é fraca.
Onde o Flash supera o Gemini 3.1 Pro
| Benchmark | 3.5 Flash | 3.1 Pro | Delta |
|---|---|---|---|
| Terminal-Bench 2.1 | 76,2% | 70,3% | +5,9 |
| MCP Atlas | 83,6% | 78,2% | +5,4 |
| Finance Agent v2 | 57,9% | 43,0% | +14,9 |
| GDPval-AA | 1656 Elo | 1314 Elo | +342 |
Todos são benchmarks de codificação e agentes — as categorias em que o Claude tem sido o padrão para desenvolvedores. O Flash agora está mais próximo do Claude nessas categorias do que o nível Pro anterior estava. Essa é uma mudança significativa de produto, não marginal.
Onde o Flash regride vs. Gemini 3.1 Pro
| Benchmark | 3.5 Flash | 3.1 Pro | Delta |
|---|---|---|---|
| Humanity’s Last Exam | 40,2% | 44,4% | −4,2 |
| ARC-AGI-2 | 72,1% | 77,1% | −5,0 |
| Contexto longo (128K) | 77,3% | 84,9% | −7,6 |
Esses três são exatamente os benchmarks onde você esperaria que um nível Pro se diferenciasse. Raciocínio profundo. Correspondência de padrões abstratos. Recuperação de contexto longo. Os dois primeiros testam profundidade; o terceiro testa a recuperação em escala. O Flash caindo 4 a 8 pontos em cada um indica que a arquitetura do Flash fez trade-offs deliberados para atingir os números de velocidade e custo.
O lançamento do 3.5 Pro em junho é quase certamente a resposta do Google a exatamente essa lista. A razão de existir do Pro é restaurar a vantagem de raciocínio e contexto longo que o Flash abdicou. Se o Pro ultrapassar o 3.1 Pro no Humanity’s Last Exam e igualar o Flash no Terminal-Bench, será o modelo frontier de produção mais forte. Se apenas corrigir a regressão ao custo da velocidade agêntica, será um posicionamento diferente.
O que a precificação do Flash implica para o Pro
O Flash foi lançado a $1,50 de entrada / $9,00 de saída por 1M de tokens no nível padrão — 40% mais barato que o Gemini 3.1 Pro em ambos os eixos. A entrada em cache é $0,15/1M, que é o número principal para cargas de trabalho com muita recuperação.
A leitura direta sobre a precificação do Pro:
- Se o Pro for lançado com preços iguais ou superiores ao Gemini 3.1 Pro (~$2,50/$15/1M ou mais), está sinalizando que o Pro é destinado a ser um nível premium de raciocínio, e não um substituto do Flash.
- Se o Pro for lançado abaixo do preço do 3.1 Pro, mas acima do Flash, está posicionado como o “Flash mais inteligente” padrão — mesma superfície de produto, maior capacidade, pequeno acréscimo.
- Se o Pro igualar o preço do Flash, isso seria incomum e colocaria o Flash na mesma posição incômoda em que o Seedance 2.0 Fast se encontra atualmente (veja nossa prévia do Seedance 2.1 / Mini para o problema análogo de colisão de níveis).
A primeira opção é a mais provável. O Google está fazendo uma aposta estrutural de que os clientes pagarão pela separação em níveis de raciocínio. O gemido da audiência sugere que o mercado acha que o Flash é suficientemente bom e que o Pro é desnecessário; não saberemos se o mercado está certo até que os desenvolvedores rodem suas próprias avaliações contra a ficha técnica do modelo de junho.
Outras coisas a observar em junho
Quando a ficha técnica do modelo Pro for divulgada, quatro pontos específicos importam:
- O Pro iguala o Flash em codificação (Terminal-Bench, MCP Atlas)? Se sim, o Pro é um superconjunto estrito. Se não, você estará executando dois endpoints — Flash para agentes, Pro para raciocínio — e o custo de integração aumenta.
- Números de contexto longo. Se o Pro restaurar a vantagem do Gemini 3.1 Pro a 128K e estender para a mesma janela de contexto de 1M de tokens que o Flash oferece, esse é o sinal mais relevante para produção. Cargas de trabalho com RAG intensivo devem planejar sua migração especificamente com base nesse número.
- Alegações multimodais. O Flash foi lançado com o mesmo entendimento de imagem/vídeo da linha 3.0. Se o Pro for lançado com a integração de geração de vídeo Gemini Omni (ainda como rumor em 20 de maio), essa seria uma história de unificação que o Google ainda não pode contar.
- Se o Pro é um modelo de raciocínio. Os modelos de raciocínio recentes do Google foram lançados com modos de “pensamento” opcionais que trocam latência por precisão. Se o 3.5 Pro ativar o modo de pensamento por padrão ou expor controle por requisição, isso afeta materialmente como você o usaria em produção.
O que fazer este mês
Enquanto o Pro está em testes internos, três ações concretas:
- Execute suas avaliações no 3.5 Flash esta semana. Ele está disponível na Gemini API, no Google AI Studio, Vertex, Antigravity e no app Gemini sob o ID de modelo
gemini-3.5-flash. Se o Flash já cobre sua carga de trabalho, talvez você não precise do Pro. - Para cargas de trabalho de contexto longo ou raciocínio intenso, permaneça no Gemini 3.1 Pro por enquanto. Não migre para baixo para o Flash só porque é o modelo mais novo — a regressão de 7,6 pontos a 128K é real. Espere pelo Pro.
- Configure seu teste A/B de junho agora. Defina a avaliação comparativa Flash → Pro antes que o Pro seja lançado. A tentação de mudar no dia do lançamento é real; o valor de um benchmark reservado que você já rodou contra o Flash e o 3.1 Pro é ainda maior.
Até o Pro ser lançado
Para cargas de trabalho de LLM, o endpoint LLM da WaveSpeedAI oferece acesso compatível com OpenAI aos atuais modelos de texto frontier por uma única chave de API. Quando o Gemini 3.5 Pro chegar em junho, espere compará-lo nesse mesmo endpoint em poucos dias — ao lado do Flash e do restante do lineup de texto frontier.
Fontes: Resumo do I/O 2026 da MacRumors, LLM Stats sobre o Gemini 3.5 Flash, Análise do Gemini 3.5 pela Felloai, BusinessToday sobre Gemini Spark e 3.5.
