Gemini 3.5 Pro arrive le mois prochain — ce que la sortie de Flash nous révèle déjà

Le lendemain de la keynote I/O 2026, la question d’avant-keynote de savoir si Google lancerait « Gemini 3.5 » ou « Gemini 4.0 » a trouvé sa réponse. C’est le 3.5. Mais la partie la plus intéressante concerne ce que Google a réellement lancé et ce qu’il a retenu : Gemini 3.5 Flash est passé en disponibilité générale le 19 mai ; Gemini 3.5 Pro arrive « le mois prochain ». La formule exacte de Sundar Pichai sur scène : « Donnez-nous jusqu’au mois prochain pour vous le livrer. »

Le public a apparemment grogné. Réaction compréhensible, mais l’écart est aussi plus intéressant qu’il n’y paraît. Flash dépasse déjà Gemini 3.1 Pro sur les benchmarks qui comptent le plus pour les développeurs — et régresse sur un ensemble spécifique de benchmarks de raisonnement et de contexte long. Le lancement de Pro un mois plus tard est presque certainement la réponse de Google à cette régression. Voici ce que le lancement de Flash nous apprend sur ce que sera réellement Pro.

Confirmé : ce que Google a dit sur le 3.5 Pro

Les déclarations de Google sur scène concernant Pro ont été minimales. L’ensemble des faits confirmés :

Détail	Source	Statut
Lancement « le mois prochain » (juin 2026)	Keynote Pichai	Confirmé
Actuellement en test interne	Keynote Pichai	Confirmé
Partagera le focus coding/agentique de Flash	Messages I/O	Confirmé
Chiffres de benchmarks spécifiques	—	Non divulgués
Tarification	—	Non divulguée
Fenêtre de contexte	—	Non divulguée
Identifiant du modèle	—	Non divulgué

C’est tout. Aucun benchmark, aucun prix, aucune fiche modèle. La sortie de Pro se résume exactement à une déclaration d’intention et un calendrier.

Ce que les données de Flash nous apprennent sur Pro

C’est là que cela devient utile. Gemini 3.5 Flash a été lancé le même jour avec des benchmarks complets, et la comparaison avec Gemini 3.1 Pro de génération précédente révèle exactement où la nouvelle génération est forte et où elle est faible.

Là où Flash surpasse Gemini 3.1 Pro

Benchmark	3.5 Flash	3.1 Pro	Écart
Terminal-Bench 2.1	76,2 %	70,3 %	+5,9
MCP Atlas	83,6 %	78,2 %	+5,4
Finance Agent v2	57,9 %	43,0 %	+14,9
GDPval-AA	1656 Elo	1314 Elo	+342

Il s’agit tous de benchmarks de coding et d’agents — les catégories où Claude était la référence par défaut pour les développeurs. Flash est désormais plus proche de Claude sur ces points que ne l’était le niveau Pro précédent. C’est un changement produit significatif, pas marginal.

Là où Flash régresse par rapport à Gemini 3.1 Pro

Benchmark	3.5 Flash	3.1 Pro	Écart
Humanity’s Last Exam	40,2 %	44,4 %	−4,2
ARC-AGI-2	72,1 %	77,1 %	−5,0
Contexte long (128K)	77,3 %	84,9 %	−7,6

Ces trois benchmarks sont exactement ceux où l’on attendrait un niveau Pro pour se différencier. Raisonnement poussé. Reconnaissance de patterns abstraits. Récupération en contexte long. Les deux premiers testent la profondeur ; le troisième teste le rappel à grande échelle. La chute de Flash de 4 à 8 points sur chacun indique que l’architecture Flash a fait des compromis délibérés pour atteindre les chiffres de vitesse et de coût.

Le lancement de 3.5 Pro en juin est presque certainement la réponse de Google à cette liste précise. La raison d’être de Pro est de restaurer l’avance en raisonnement et en contexte long que Flash a sacrifiée. Si Pro se positionne au-dessus de 3.1 Pro sur Humanity’s Last Exam et égale Flash sur Terminal-Bench, c’est le modèle frontier de production le plus fort. S’il ne fait que corriger la régression au prix de la vitesse agentique, c’est un positionnement différent.

Ce que la tarification de Flash implique pour Pro

Flash a été lancé à 1,50 $ en entrée / 9,00 $ en sortie par million de tokens sur le niveau standard — 40 % moins cher que Gemini 3.1 Pro sur les deux axes. L’entrée en cache est à 0,15 $/1M, ce qui est le chiffre phare pour les charges de travail lourdes en récupération.

La lecture directe sur la tarification de Pro :

Si Pro se lance à la tarification de Gemini 3.1 Pro ou au-dessus (~2,50 $/15 $/1M ou plus), cela signale que Pro est conçu comme un niveau de raisonnement premium plutôt que comme un remplacement de Flash.
Si Pro se lance en dessous du prix de 3.1 Pro mais au-dessus de Flash, il est positionné comme le « Flash plus intelligent » par défaut — même surface produit, capacité supérieure, légère prime.
Si Pro correspond à la tarification de Flash, ce serait inhabituel et placerait Flash dans la même position inconfortable où se trouve actuellement Seedance 2.0 Fast (voir notre aperçu Seedance 2.1 / Mini pour le problème analogue de collision de niveaux).

La première option est la plus probable. Google parie structurellement que les clients paieront pour la séparation du niveau de raisonnement. Le grognement du public suggère que le marché pense que Flash est suffisant et que Pro est inutile ; nous ne saurons pas si le marché a raison jusqu’à ce que les développeurs exécutent leurs propres évaluations contre la fiche modèle de juin.

Autres éléments à surveiller en juin

Quand la fiche modèle de Pro sera publiée, quatre points spécifiques seront importants :

Pro égale-t-il Flash sur le coding (Terminal-Bench, MCP Atlas) ? Si oui, Pro est un sur-ensemble strict. Sinon, vous utiliserez deux endpoints — Flash pour les agents, Pro pour le raisonnement — et le coût d’intégration augmente.
Les chiffres de contexte long. Si Pro restaure l’avance de Gemini 3.1 Pro à 128K et s’étend à la même fenêtre de contexte de 1M tokens que Flash, c’est le signal le plus pertinent pour la production. Les charges de travail RAG-intensives devraient planifier leur migration sur ce chiffre spécifiquement.
Les revendications multimodales. Flash a été lancé avec la même compréhension image/vidéo que la ligne 3.0. Si Pro est livré avec l’intégration de génération vidéo Gemini Omni (toujours au stade de rumeur au 20 mai), c’est une histoire d’unification que Google ne peut pas encore raconter.
Si Pro est un modèle de réflexion. Les récents modèles de raisonnement de Google ont été livrés avec des modes de « réflexion » optionnels qui échangent la latence contre la précision. Si 3.5 Pro active la réflexion par défaut ou expose un contrôle par requête, cela affecte matériellement la façon dont vous l’utiliseriez en production.

Que faire ce mois-ci

Pendant que Pro est en test interne, trois actions concrètes :

Exécutez vos évaluations contre 3.5 Flash cette semaine. Il est disponible sur l’API Gemini, Google AI Studio, Vertex, Antigravity, et l’application Gemini sous l’identifiant modèle gemini-3.5-flash. Si Flash couvre déjà votre charge de travail, vous n’aurez peut-être pas besoin de Pro du tout.
Pour les charges de travail en contexte long ou en raisonnement intensif, restez sur Gemini 3.1 Pro pour l’instant. Ne migrez pas vers Flash simplement parce que c’est le modèle le plus récent — la régression de 7,6 points à 128K est réelle. Attendez Pro.
Configurez votre test A/B de juin maintenant. Définissez l’évaluation de comparaison Flash → Pro avant que Pro ne soit disponible. La tentation de basculer le jour du lancement est réelle ; la valeur d’un benchmark réservé que vous avez déjà exécuté contre Flash et 3.1 Pro est encore plus réelle.

En attendant Pro

Pour les charges de travail côté LLM, le point de terminaison LLM WaveSpeedAI vous donne un accès compatible OpenAI aux modèles de texte frontier actuels derrière une seule clé API. Quand Gemini 3.5 Pro arrivera en juin, attendez-vous à le comparer sous ce même point de terminaison en quelques jours — aux côtés de Flash et du reste de la gamme de texte frontier.

Sources : MacRumors I/O 2026 roundup, LLM Stats sur Gemini 3.5 Flash, Felloai Gemini 3.5 review, BusinessToday sur Gemini Spark et 3.5.

Confirmé : ce que Google a dit sur le 3.5 Pro

Ce que les données de Flash nous apprennent sur Pro

Là où Flash surpasse Gemini 3.1 Pro

Là où Flash régresse par rapport à Gemini 3.1 Pro

Ce que la tarification de Flash implique pour Pro

Autres éléments à surveiller en juin

Que faire ce mois-ci

En attendant Pro

Articles associés

Claude Fable 5 vient de sortir : 80,3 % sur SWE-Bench Pro, prix 2× Opus 4.8, gratuit jusqu'au 22 juin

Gemini 3.5 Flash est disponible — un modèle Flash-tier domine désormais le tier Pro sur les benchmarks d'agents

Gemini Omni Flash est disponible : vidéo multi-modale en 10 secondes, watermark SynthID, édition audio non incluse

Gemini 4.0 à Google I/O 2026 : Ce qui est confirmé, ce qui vient de sources anonymes, ce que les développeurs doivent vraiment surveiller

Les démos de Gemini Omni viennent de fuiter — voici ce que fait vraiment le nouveau modèle vidéo de Google

Le mystérieux modèle vidéo 'Omni' de Google : ce que la fuite de l'interface Gemini nous révèle avant Google I/O 2026