Gemini 3.5 Pro arrive le mois prochain — ce que la sortie de Flash nous révèle déjà
Google a lancé Gemini 3.5 Flash à I/O 2026 et a réservé Pro pour juin. Flash surpasse déjà Gemini 3.1 Pro sur les benchmarks de codage et d'agents, mais régresse sur le raisonnement complexe — exactement le fossé que Pro doit combler. Voici ce qui est connu, ce qui ne l'est pas, et comment planifier.
Le lendemain de la keynote I/O 2026, la question d’avant-keynote de savoir si Google lancerait « Gemini 3.5 » ou « Gemini 4.0 » a trouvé sa réponse. C’est le 3.5. Mais la partie la plus intéressante concerne ce que Google a réellement lancé et ce qu’il a retenu : Gemini 3.5 Flash est passé en disponibilité générale le 19 mai ; Gemini 3.5 Pro arrive « le mois prochain ». La formule exacte de Sundar Pichai sur scène : « Donnez-nous jusqu’au mois prochain pour vous le livrer. »
Le public a apparemment grogné. Réaction compréhensible, mais l’écart est aussi plus intéressant qu’il n’y paraît. Flash dépasse déjà Gemini 3.1 Pro sur les benchmarks qui comptent le plus pour les développeurs — et régresse sur un ensemble spécifique de benchmarks de raisonnement et de contexte long. Le lancement de Pro un mois plus tard est presque certainement la réponse de Google à cette régression. Voici ce que le lancement de Flash nous apprend sur ce que sera réellement Pro.
Confirmé : ce que Google a dit sur le 3.5 Pro
Les déclarations de Google sur scène concernant Pro ont été minimales. L’ensemble des faits confirmés :
| Détail | Source | Statut |
|---|---|---|
| Lancement « le mois prochain » (juin 2026) | Keynote Pichai | Confirmé |
| Actuellement en test interne | Keynote Pichai | Confirmé |
| Partagera le focus coding/agentique de Flash | Messages I/O | Confirmé |
| Chiffres de benchmarks spécifiques | — | Non divulgués |
| Tarification | — | Non divulguée |
| Fenêtre de contexte | — | Non divulguée |
| Identifiant du modèle | — | Non divulgué |
C’est tout. Aucun benchmark, aucun prix, aucune fiche modèle. La sortie de Pro se résume exactement à une déclaration d’intention et un calendrier.
Ce que les données de Flash nous apprennent sur Pro
C’est là que cela devient utile. Gemini 3.5 Flash a été lancé le même jour avec des benchmarks complets, et la comparaison avec Gemini 3.1 Pro de génération précédente révèle exactement où la nouvelle génération est forte et où elle est faible.
Là où Flash surpasse Gemini 3.1 Pro
| Benchmark | 3.5 Flash | 3.1 Pro | Écart |
|---|---|---|---|
| Terminal-Bench 2.1 | 76,2 % | 70,3 % | +5,9 |
| MCP Atlas | 83,6 % | 78,2 % | +5,4 |
| Finance Agent v2 | 57,9 % | 43,0 % | +14,9 |
| GDPval-AA | 1656 Elo | 1314 Elo | +342 |
Il s’agit tous de benchmarks de coding et d’agents — les catégories où Claude était la référence par défaut pour les développeurs. Flash est désormais plus proche de Claude sur ces points que ne l’était le niveau Pro précédent. C’est un changement produit significatif, pas marginal.
Là où Flash régresse par rapport à Gemini 3.1 Pro
| Benchmark | 3.5 Flash | 3.1 Pro | Écart |
|---|---|---|---|
| Humanity’s Last Exam | 40,2 % | 44,4 % | −4,2 |
| ARC-AGI-2 | 72,1 % | 77,1 % | −5,0 |
| Contexte long (128K) | 77,3 % | 84,9 % | −7,6 |
Ces trois benchmarks sont exactement ceux où l’on attendrait un niveau Pro pour se différencier. Raisonnement poussé. Reconnaissance de patterns abstraits. Récupération en contexte long. Les deux premiers testent la profondeur ; le troisième teste le rappel à grande échelle. La chute de Flash de 4 à 8 points sur chacun indique que l’architecture Flash a fait des compromis délibérés pour atteindre les chiffres de vitesse et de coût.
Le lancement de 3.5 Pro en juin est presque certainement la réponse de Google à cette liste précise. La raison d’être de Pro est de restaurer l’avance en raisonnement et en contexte long que Flash a sacrifiée. Si Pro se positionne au-dessus de 3.1 Pro sur Humanity’s Last Exam et égale Flash sur Terminal-Bench, c’est le modèle frontier de production le plus fort. S’il ne fait que corriger la régression au prix de la vitesse agentique, c’est un positionnement différent.
Ce que la tarification de Flash implique pour Pro
Flash a été lancé à 1,50 $ en entrée / 9,00 $ en sortie par million de tokens sur le niveau standard — 40 % moins cher que Gemini 3.1 Pro sur les deux axes. L’entrée en cache est à 0,15 $/1M, ce qui est le chiffre phare pour les charges de travail lourdes en récupération.
La lecture directe sur la tarification de Pro :
- Si Pro se lance à la tarification de Gemini 3.1 Pro ou au-dessus (~2,50 $/15 $/1M ou plus), cela signale que Pro est conçu comme un niveau de raisonnement premium plutôt que comme un remplacement de Flash.
- Si Pro se lance en dessous du prix de 3.1 Pro mais au-dessus de Flash, il est positionné comme le « Flash plus intelligent » par défaut — même surface produit, capacité supérieure, légère prime.
- Si Pro correspond à la tarification de Flash, ce serait inhabituel et placerait Flash dans la même position inconfortable où se trouve actuellement Seedance 2.0 Fast (voir notre aperçu Seedance 2.1 / Mini pour le problème analogue de collision de niveaux).
La première option est la plus probable. Google parie structurellement que les clients paieront pour la séparation du niveau de raisonnement. Le grognement du public suggère que le marché pense que Flash est suffisant et que Pro est inutile ; nous ne saurons pas si le marché a raison jusqu’à ce que les développeurs exécutent leurs propres évaluations contre la fiche modèle de juin.
Autres éléments à surveiller en juin
Quand la fiche modèle de Pro sera publiée, quatre points spécifiques seront importants :
- Pro égale-t-il Flash sur le coding (Terminal-Bench, MCP Atlas) ? Si oui, Pro est un sur-ensemble strict. Sinon, vous utiliserez deux endpoints — Flash pour les agents, Pro pour le raisonnement — et le coût d’intégration augmente.
- Les chiffres de contexte long. Si Pro restaure l’avance de Gemini 3.1 Pro à 128K et s’étend à la même fenêtre de contexte de 1M tokens que Flash, c’est le signal le plus pertinent pour la production. Les charges de travail RAG-intensives devraient planifier leur migration sur ce chiffre spécifiquement.
- Les revendications multimodales. Flash a été lancé avec la même compréhension image/vidéo que la ligne 3.0. Si Pro est livré avec l’intégration de génération vidéo Gemini Omni (toujours au stade de rumeur au 20 mai), c’est une histoire d’unification que Google ne peut pas encore raconter.
- Si Pro est un modèle de réflexion. Les récents modèles de raisonnement de Google ont été livrés avec des modes de « réflexion » optionnels qui échangent la latence contre la précision. Si 3.5 Pro active la réflexion par défaut ou expose un contrôle par requête, cela affecte matériellement la façon dont vous l’utiliseriez en production.
Que faire ce mois-ci
Pendant que Pro est en test interne, trois actions concrètes :
- Exécutez vos évaluations contre 3.5 Flash cette semaine. Il est disponible sur l’API Gemini, Google AI Studio, Vertex, Antigravity, et l’application Gemini sous l’identifiant modèle
gemini-3.5-flash. Si Flash couvre déjà votre charge de travail, vous n’aurez peut-être pas besoin de Pro du tout. - Pour les charges de travail en contexte long ou en raisonnement intensif, restez sur Gemini 3.1 Pro pour l’instant. Ne migrez pas vers Flash simplement parce que c’est le modèle le plus récent — la régression de 7,6 points à 128K est réelle. Attendez Pro.
- Configurez votre test A/B de juin maintenant. Définissez l’évaluation de comparaison Flash → Pro avant que Pro ne soit disponible. La tentation de basculer le jour du lancement est réelle ; la valeur d’un benchmark réservé que vous avez déjà exécuté contre Flash et 3.1 Pro est encore plus réelle.
En attendant Pro
Pour les charges de travail côté LLM, le point de terminaison LLM WaveSpeedAI vous donne un accès compatible OpenAI aux modèles de texte frontier actuels derrière une seule clé API. Quand Gemini 3.5 Pro arrivera en juin, attendez-vous à le comparer sous ce même point de terminaison en quelques jours — aux côtés de Flash et du reste de la gamme de texte frontier.
Sources : MacRumors I/O 2026 roundup, LLM Stats sur Gemini 3.5 Flash, Felloai Gemini 3.5 review, BusinessToday sur Gemini Spark et 3.5.
