WaveSpeed Blog

Dernières actualités sur les modèles de génération d'images et vidéos IA — mises à jour techniques, lancements de produits, tutoriels et analyses approfondies.

Gemini 3.5 Pro arrive le mois prochain — ce que la sortie de Flash nous révèle déjà
gemini-3-5gemini-3-5-pro

Gemini 3.5 Pro arrive le mois prochain — ce que la sortie de Flash nous révèle déjà

Google a lancé Gemini 3.5 Flash à I/O 2026 et a réservé Pro pour juin. Flash surpasse déjà Gemini 3.1 Pro sur les benchmarks de codage et d'agents, mais régresse sur le raisonnement complexe — exactement le fossé que Pro doit combler. Voici ce qui est connu, ce qui ne l'est pas, et comment planifier.

7 min read
Gemini 3.5 Flash est disponible — un modèle Flash-tier domine désormais le tier Pro sur les benchmarks d'agents
gemini-3-5-flashgoogle

Gemini 3.5 Flash est disponible — un modèle Flash-tier domine désormais le tier Pro sur les benchmarks d'agents

Gemini 3.5 Flash est passé en disponibilité générale à I/O 2026 avec la réflexion activée par défaut, 1,50 $/9 $ par million de tokens, et un profil de benchmark qui surpasse Claude Opus 4.7 et GPT-5.5 sur MCP Atlas et la plupart des suites d'agents. Voici où Flash est en tête, où il est dépassé, et comment le déployer.

10 min read
Gemini Omni Flash est disponible : vidéo multi-modale en 10 secondes, watermark SynthID, édition audio non incluse
gemini-omnigemini-omni-flash

Gemini Omni Flash est disponible : vidéo multi-modale en 10 secondes, watermark SynthID, édition audio non incluse

Google a lancé Gemini Omni Flash à I/O 2026 — un seul modèle capable de raisonner sur du texte, des images, de l'audio et de la vidéo pour produire une sortie vidéo cohérente avec audio synchronisé. Voici ce qui a été livré, ce qui ne l'a pas été, et en quoi il diffère de Veo.

8 min read
Fuite Arcanine : Ce que les développeurs ne doivent pas supposer

Fuite Arcanine : Ce que les développeurs ne doivent pas supposer

Arcanine a fait surface dans les discussions sur les fuites d'IA, mais ce n'est pas un nom de modèle public officiel. Voici comment les développeurs devraient interpréter ce signal.

9 min read
Gemini 4.0 à Google I/O 2026 : Ce qui est confirmé, ce qui vient de sources anonymes, ce que les développeurs doivent vraiment surveiller
gemini-4google

Gemini 4.0 à Google I/O 2026 : Ce qui est confirmé, ce qui vient de sources anonymes, ce que les développeurs doivent vraiment surveiller

Google I/O s'ouvre aujourd'hui à 10h PT. Les informations pré-keynote sur le nouveau Gemini vont de 'version 3.5 incrémentale' à 'Gemini 4.0 complet avec une intégration plus poussée'. Voici ce qui est réellement confirmé par rapport aux sources anonymes — et les sept points que les développeurs devraient évaluer dès que la fiche du modèle sera publiée.

8 min read
Qu'est-ce qu'OpenAI Glacier-Alpha ? Ce que nous savons réellement

Qu'est-ce qu'OpenAI Glacier-Alpha ? Ce que nous savons réellement

Glacier-alpha est apparu dans des discussions sur les fuites d'OpenAI, mais il n'existe pas de page produit officielle. Voici ce que les développeurs devraient et ne devraient pas en déduire.

10 min read
Seedance 2.1 et Seedance 2.0 Mini arrivent : amélioration de la qualité, niveau de prix inférieur
seedancebytedance

Seedance 2.1 et Seedance 2.0 Mini arrivent : amélioration de la qualité, niveau de prix inférieur

ByteDance prépare deux nouvelles variantes Seedance : Seedance 2.1 avec une amélioration de la qualité de génération d'environ 20 % selon les rapports, et un nouveau niveau Mini censé être bien en dessous du prix actuel de Seedance tout en surpassant Seedance 2.0 Fast.

8 min read
Ce que les négociations de financement de DeepSeek signifient pour les plateformes de modèles

Ce que les négociations de financement de DeepSeek signifient pour les plateformes de modèles

Les négociations de financement rapportées de DeepSeek pourraient signaler bien plus qu'une hausse de valorisation. Voici ce qu'elles pourraient signifier pour le pouvoir de tarification des modèles et la stratégie de plateforme.

11 min read
Pourquoi les développeurs devraient ignorer les noms de modèles divulgués

Pourquoi les développeurs devraient ignorer les noms de modèles divulgués

Les noms de modèles divulgués comme oai-2.1 créent du bruit, mais les équipes en production ont besoin de documentation, de tarifs, de limites et de signaux de support avant d'agir.

10 min read
design.md vs Tokens de Design pour les Workflows d'UI IA

design.md vs Tokens de Design pour les Workflows d'UI IA

Comparez design.md et les tokens de design traditionnels pour les workflows d'UI IA, en mettant l'accent sur la lisibilité par les agents, la cohérence et la portabilité des workflows.

11 min read
Qu'est-ce que ML Intern et pourquoi les agents verticaux sont importants

Qu'est-ce que ML Intern et pourquoi les agents verticaux sont importants

ML Intern est un agent d'ingénierie ML open-source conçu autour des workflows de recherche et d'entraînement. Voici ce qu'il signale sur la prochaine phase des agents verticaux.

11 min read
GPT-5.6 vient d'apparaître dans les journaux Codex d'OpenAI — voici ce que cela signifie vraiment
gpt-5-6openai

GPT-5.6 vient d'apparaître dans les journaux Codex d'OpenAI — voici ce que cela signifie vraiment

Une seule entrée de routage dans les journaux de déploiement Codex d'OpenAI pointait vers GPT-5.6. Polymarket est à 89 % sur une sortie le 30 juin. Voici ce qui est confirmé, ce qui est du bruit, et pourquoi l'incident du goblin explique la rapidité des tests.

10 min read