Gemini 4.0 à Google I/O 2026 : Ce qui est confirmé, ce qui vient de sources anonymes, ce que les développeurs doivent vraiment surveiller

Google I/O 2026 commence dans quelques heures. Les reportages d’avant-keynote sur ce qui va être annoncé sont les plus contradictoires que j’aie vus pour un événement phare de Google — les médias sont divisés sur le nom (Gemini 3.5 ou Gemini 4.0), et la phrase la plus citée (« se situe derrière Claude Mythos, à peu près au niveau de GPT-5.5 ») provient de sources anonymes, pas de benchmarks.

Pour les développeurs, c’est en réalité une information utile. Elle vous indique quels signaux attendre et lesquels ignorer. Voici une séparation claire entre ce qui est confirmé avant l’ouverture de la keynote, ce qui provient de sources anonymes, et les sept points à évaluer dès que la fiche modèle sera publiée.

Ce qui est confirmé avant la keynote

Élément	Source	Statut
La keynote ouvre le 19 mai à 10h PT, Shoreline Amphitheatre	Google	Confirmé
Sundar Pichai dirige la keynote	Google	Confirmé
Annonce d’un nouveau modèle Gemini à l’ordre du jour	Google	Confirmé
Aperçu des lunettes Android XR	Google	Confirmé
Mises à jour de plusieurs niveaux Gemini (Pro, Flash, Ultra)	Plusieurs médias, citant des sources internes	Fortement indiqué
Présentation du modèle vidéo Gemini Omni	Chaînes UI + démos divulguées	Fortement indiqué (couverture précédente)
Gemma 4 déjà lancé le 2 avril (ligne séparée)	Google	Confirmé

C’est le plancher. Tout le reste est spéculation jusqu’à l’ouverture de la keynote.

Ce qui provient de sources anonymes

Le cadrage dominant d’avant-keynote dans TechTimes, sources.news et l’aperçu d’AIxploria se lit à peu près ainsi :

Des sources décrivent la version attendue comme se situant à peu près au niveau de GPT-5.5 d’OpenAI, et nettement en dessous de Claude Mythos d’Anthropic.

Plusieurs médias, citant des sources anonymes, décrivent la mise à jour comme une amélioration significative du raisonnement et des capacités multimodales, mais pas un « changement de paradigme », notamment dans les benchmarks de performance en programmation qui ont fait de Claude d’Anthropic le choix par défaut de nombreux développeurs logiciels.

Trois points méritent d’être signalés :

Tout est anonyme. Aucun média ne cite un employé de Google en son nom. Aucun média ne présente un benchmark divulgué. Le cadrage « derrière Mythos, à peu près au niveau de GPT-5.5 » est une affirmation de positionnement de personnes ayant vraisemblablement vu des évaluations internes, mais qui n’a pas été vérifiée de manière indépendante.
Le nom n’est pas arrêté. Certains rapports évoquent « Gemini 3.5 » ; d’autres parlent de « Gemini 4.0 avec une intégration plus profonde ». Un saut de 3.5 → 4.0 signale généralement un changement d’architecture ; un saut de 3.x → 3.5 se rapproche davantage d’un entraînement prolongé. Le nom choisi sur scène vous dira lequel c’est vraiment.
« Pas un changement de paradigme en programmation » est une affirmation précise. Si elle est exacte, c’est important : Claude d’Anthropic est devenu le modèle de programmation par défaut parmi les développeurs précisément parce que ses évaluations en codage (SWE-bench, Terminal-Bench, LiveCodeBench) ont progressé plus vite que ses concurrents. Un Gemini qui ne comble pas cet écart dès le premier jour reste un outil de multimodalité et de distribution, pas un outil de programmation.

La lecture honnête : nous ne savons pas encore. Attendez la fiche système.

L’argument en faveur d’un « incrémental, c’est bien »

Si la keynote présente un Gemini incrémental plutôt qu’un leader frontier, ce n’est pas le désastre que suggère le cadrage d’avant-keynote. Le levier de Google n’est pas les victoires sur les benchmarks ; c’est la distribution. Trois chiffres de l’analyse TradingKey méritent d’être gardés à l’esprit :

Le carnet de commandes de Google Cloud a atteint 462 milliards de dollars. Quel que soit le niveau auquel Gemini est lancé, il sera vendu dans des pipelines d’entreprise existants qui ne font pas tourner des déploiements OpenAI ou Anthropic.
Gemini Intelligence est lancé sur les Samsung Galaxy et Google Pixel en été 2026. C’est plus de 250 millions d’appareils recevant un LLM natif la même année. Aucun concurrent n’a cette distribution.
AI Max remplace les Dynamic Search Ads traditionnels de Google en septembre. C’est un flux de revenus en migration forcée qui ne dépend pas du fait que Gemini soit le meilleur modèle — seulement qu’il soit suffisamment bon.

Si Gemini 4.0 est lancé avec la qualité de GPT-5.5 et un déploiement natif sur des milliards d’appareils, c’est une histoire de produit différente de « nous sommes derrière Claude sur SWE-bench ». Les deux peuvent être vrais simultanément.

Sept choses que les développeurs devraient réellement évaluer dès que la fiche modèle sera publiée

Si vous déployez quoi que ce soit qui s’exécute contre une API de modèle frontier aujourd’hui, voici les signaux à attendre. Ignorez tout le reste.

1. Les chiffres des benchmarks de programmation — en particulier SWE-bench Verified et Terminal-Bench 2.0

Si Gemini 4.0 atteint >75% sur SWE-bench Verified et >80% sur Terminal-Bench 2.0, le cadrage « derrière Mythos » était faux. S’il atteint 60–70% sur les deux, le cadrage était juste et Claude reste le choix par défaut pour les workflows de programmation en production.

2. La tarification

Comparez avec Sonnet 4.6 actuel (3 $ en entrée / 15 $ en sortie par million de tokens) et GPT-5.5 (1,25 $/10 $). Si Google se positionne en dessous ou à égalité avec une fenêtre de contexte de 1M+ tokens, le calcul de valeur change. S’ils se positionnent à parité avec Sonnet pour des capacités comparables, le choix devient principalement une question d’intégration.

3. La fenêtre de contexte

Gemini 2.5 Pro était lancé avec 2M tokens. Si Gemini 4.0 maintient ou dépasse cela, il aura toujours la plus longue fenêtre de contexte en production de l’industrie. S’il revient à 1M pour s’aligner sur les concurrents, c’est une régression à noter.

4. La latence d’utilisation des outils

La frontière intéressante pour les workflows agentiques n’est pas l’intelligence maximale — c’est la vitesse à laquelle le modèle peut enchaîner les appels d’outils. Surveillez le temps jusqu’au premier appel d’outil et la latence de bout en bout sur une évaluation agentique multi-étapes. Si Gemini atteint une latence de premier appel inférieure à 200 ms, cela ouvre des catégories d’applications que la concurrence ne peut pas égaler.

5. La surface API Vertex AI / AI Studio

Plus précisément : le même identifiant de modèle fonctionne-t-il sur les deux, ou existe-t-il une variante réservée à l’application Gemini ? Les divisions entre endpoints consommateurs et développeurs ont déjà créé des maux de tête de versionnement. Une surface API unique et unifiée entre consommateurs et développeurs serait une vraie amélioration.

6. La jonction multimodale avec Omni

Si Gemini Omni (le modèle vidéo) est lancé aux côtés du modèle de langage avec une API unifiée — texte-vers-vidéo et compréhension vidéo surfaçant tous deux via le même endpoint que la génération de texte — c’est ce qui se rapproche le plus d’une vraie version frontier omni-modale. Si ce sont des endpoints séparés, le nom « omni » est du marketing.

7. La variante Nano

L’existence d’un nouveau Gemini Nano avec des performances utilisables sur appareil importe davantage que le modèle phare pour de nombreuses catégories de produits. Les modèles de moins de 3 milliards de paramètres fonctionnant localement sur Pixel et Galaxy ouvrent des catégories de produits (résumé hors ligne, utilisation d’outils sur l’appareil, UX critique en latence) que les modèles cloud ne peuvent pas atteindre.

Que faire jusqu’à la keynote

Trois actions concrètes pendant l’attente :

Ne changez rien en production. Si vous êtes sur Claude, GPT-5.5 ou Gemini actuel, restez-y jusqu’à ce que vous ayez de vraies données de benchmark. Les sources anonymes d’avant-keynote ne constituent pas une base pour une migration.
Préparez votre ensemble d’évaluations. Si vous n’avez pas déjà un benchmark réservé sur lequel vous avez testé les trois modèles frontier, vous passerez les deux prochaines semaines à lire du contenu marketing au lieu d’avoir des données. Définissez l’évaluation avant que le modèle arrive.
Regardez d’abord la fiche système, ensuite l’article de blog, enfin la vidéo marketing en dernier. La fiche système contient les chiffres vérifiables ; le matériel marketing contient le cadrage.

D’ici là

Les modèles d’images Gemini de la série 3 existants — Gemini 3 Flash Image, Gemini 3 Pro Image (alias Nano Banana) — sont disponibles dès aujourd’hui sur WaveSpeedAI sous la même API que le reste du catalogue de modèles.

Pour les charges de travail côté LLM, l’endpoint LLM WaveSpeedAI vous offre un accès compatible OpenAI aux modèles texte frontier actuels derrière une seule clé API. Lorsque le nouveau modèle de langage Gemini sera disponible publiquement, attendez-vous à pouvoir le comparer sous ce même endpoint en quelques jours.

Sources : Aperçu I/O d’Android Authority, Analyse pré-keynote de TechTimes, Aperçu des annonces d’AIxploria, Angle monétisation TradingKey, sources.news.

Ce qui est confirmé avant la keynote

Ce qui provient de sources anonymes

L’argument en faveur d’un « incrémental, c’est bien »

Sept choses que les développeurs devraient réellement évaluer dès que la fiche modèle sera publiée

1. Les chiffres des benchmarks de programmation — en particulier SWE-bench Verified et Terminal-Bench 2.0

2. La tarification

3. La fenêtre de contexte

4. La latence d’utilisation des outils

5. La surface API Vertex AI / AI Studio

6. La jonction multimodale avec Omni

7. La variante Nano

Que faire jusqu’à la keynote

D’ici là

Articles associés

Claude Fable 5 vient de sortir : 80,3 % sur SWE-Bench Pro, prix 2× Opus 4.8, gratuit jusqu'au 22 juin

Gemini 3.5 Flash est disponible — un modèle Flash-tier domine désormais le tier Pro sur les benchmarks d'agents

Gemini 3.5 Pro arrive le mois prochain — ce que la sortie de Flash nous révèle déjà

Gemini Omni Flash est disponible : vidéo multi-modale en 10 secondes, watermark SynthID, édition audio non incluse

Les démos de Gemini Omni viennent de fuiter — voici ce que fait vraiment le nouveau modèle vidéo de Google

Le mystérieux modèle vidéo 'Omni' de Google : ce que la fuite de l'interface Gemini nous révèle avant Google I/O 2026