Gemini 3.5 Pro llegará el próximo mes — Lo que el lanzamiento de Flash ya nos dice
Google lanzó Gemini 3.5 Flash en I/O 2026 y reservó Pro para junio. Flash ya supera a Gemini 3.1 Pro en benchmarks de codificación y agentes, pero retrocedió en razonamiento complejo — exactamente la brecha que Pro necesita cerrar. Esto es lo que se sabe, lo que no, y cómo planificar.
El día después del keynote de I/O 2026, la pregunta previa al keynote de si Google lanzaría “Gemini 3.5” o “Gemini 4.0” obtuvo respuesta. Es 3.5. Pero la parte más interesante es lo que Google realmente lanzó y lo que retuvo: Gemini 3.5 Flash llegó a disponibilidad general el 19 de mayo; Gemini 3.5 Pro “llegará el próximo mes.” La frase exacta de Sundar Pichai en el escenario: “Denos hasta el próximo mes para hacérselo llegar.”
Según los reportes, el público exhaló un quejido. Reacción razonable, pero la brecha también es más interesante de lo que parece. Flash ya supera a Gemini 3.1 Pro en los benchmarks que más importan a los desarrolladores — y regresa en un conjunto específico de benchmarks de razonamiento y contexto largo. El lanzamiento de Pro un mes después es casi con certeza la respuesta de Google a esa regresión. Esto es lo que el lanzamiento de Flash nos dice sobre lo que Pro realmente será.
Confirmado: lo que Google dijo sobre 3.5 Pro
Las declaraciones de Google en el escenario sobre Pro fueron mínimas. El conjunto completo de hechos confirmados:
| Detalle | Fuente | Estado |
|---|---|---|
| Lanza “el próximo mes” (junio 2026) | Keynote de Pichai | Confirmado |
| Actualmente en pruebas internas | Keynote de Pichai | Confirmado |
| Compartirá el enfoque de codificación/agéntico de Flash | Mensajes de I/O | Confirmado |
| Números específicos de benchmark | — | No divulgados |
| Precios | — | No divulgados |
| Ventana de contexto | — | No divulgada |
| ID del modelo | — | No divulgado |
Eso es todo. Sin benchmarks, sin precios, sin tarjeta de modelo. El lanzamiento de Pro es exactamente una declaración de intención y un cronograma.
Lo que los datos de Flash nos dicen sobre Pro
Aquí es donde se vuelve útil. Gemini 3.5 Flash se lanzó el mismo día con benchmarks completos, y la comparación con la generación anterior Gemini 3.1 Pro revela exactamente dónde es fuerte la nueva generación y dónde es débil.
Dónde Flash supera a Gemini 3.1 Pro
| Benchmark | 3.5 Flash | 3.1 Pro | Delta |
|---|---|---|---|
| Terminal-Bench 2.1 | 76.2% | 70.3% | +5.9 |
| MCP Atlas | 83.6% | 78.2% | +5.4 |
| Finance Agent v2 | 57.9% | 43.0% | +14.9 |
| GDPval-AA | 1656 Elo | 1314 Elo | +342 |
Todos son benchmarks de codificación y agénticos — las categorías donde Claude ha sido el predeterminado para desarrolladores. Flash ahora está más cerca de Claude en estos que lo que estaba el nivel Pro anterior. Eso es un cambio de producto significativo, no uno marginal.
Dónde Flash regresa vs Gemini 3.1 Pro
| Benchmark | 3.5 Flash | 3.1 Pro | Delta |
|---|---|---|---|
| Humanity’s Last Exam | 40.2% | 44.4% | −4.2 |
| ARC-AGI-2 | 72.1% | 77.1% | −5.0 |
| Contexto largo (128K) | 77.3% | 84.9% | −7.6 |
Estos tres son los exactos benchmarks donde esperarías que un nivel Pro se diferenciara. Razonamiento profundo. Reconocimiento de patrones abstractos. Recuperación de contexto largo. Los dos primeros ponen a prueba la profundidad; el tercero pone a prueba la recuperación a escala. Que Flash caiga 4-8 puntos en cada uno indica que la arquitectura de Flash realizó intercambios deliberados para alcanzar los números de velocidad y costo.
El lanzamiento de 3.5 Pro en junio es casi con certeza la respuesta de Google a esta lista exacta. La razón de existir de Pro es restaurar la ventaja en razonamiento y contexto largo que Flash cedió. Si Pro supera a 3.1 Pro en Humanity’s Last Exam y iguala a Flash en Terminal-Bench, es el modelo de frontera de producción más sólido. Si solo corrige la regresión a costa de la velocidad agéntica, es un posicionamiento diferente.
Lo que los precios de Flash implican para Pro
Flash se lanzó a $1.50 de entrada / $9.00 de salida por 1M de tokens en el nivel estándar — un 40% más barato que Gemini 3.1 Pro en ambos ejes. La entrada en caché es $0.15/1M, que es el número destacado para cargas de trabajo con mucha recuperación.
La lectura directa sobre los precios de Pro:
- Si Pro se lanza a los precios de Gemini 3.1 Pro o superiores (~$2.50/$15/1M o más), está señalando que Pro está destinado como un nivel de razonamiento premium en lugar de un reemplazo de Flash.
- Si Pro se lanza por debajo del precio de 3.1 Pro pero por encima de Flash, se posiciona como el “Flash más inteligente” predeterminado — misma superficie de producto, mayor capacidad, prima modesta.
- Si Pro iguala los precios de Flash, eso sería inusual y pondría a Flash en la misma posición incómoda en la que Seedance 2.0 Fast se encuentra actualmente (ver nuestro avance de Seedance 2.1 / Mini para el problema análogo de colisión de niveles).
La primera opción es la más probable. Google está haciendo una apuesta estructural de que los clientes pagarán por la separación del nivel de razonamiento. El quejido del público sugiere que el mercado cree que Flash es suficientemente bueno y que Pro es innecesario; no sabremos si el mercado tiene razón hasta que los desarrolladores ejecuten sus propias evaluaciones contra la tarjeta de modelo de junio.
Otras cosas a vigilar en junio
Cuando se publique la tarjeta del modelo Pro, cuatro detalles importan:
- ¿Pro iguala a Flash en codificación (Terminal-Bench, MCP Atlas)? Si es así, Pro es un superconjunto estricto. Si no, estarás ejecutando dos endpoints — Flash para agentes, Pro para razonamiento — y el costo de integración aumenta.
- Números de contexto largo. Si Pro restaura la ventaja de Gemini 3.1 Pro en 128K y se extiende a la misma ventana de contexto de 1M de tokens con la que Flash se lanza, esa es la señal más relevante para producción. Las cargas de trabajo con mucho RAG deben planificar su migración específicamente en este número.
- Afirmaciones multimodales. Flash se lanzó con la misma comprensión de imagen/video que la línea 3.0. Si Pro se lanza con la integración de generación de video Gemini Omni (aún rumorada al 20 de mayo), esa es una historia de unificación que Google aún no puede contar.
- Si Pro es un modelo de pensamiento. Los modelos de razonamiento recientes de Google se han lanzado con modos opcionales de “pensamiento” que intercambian latencia por precisión. Si 3.5 Pro activa el pensamiento por defecto o expone control por solicitud, eso afecta materialmente cómo lo usarías en producción.
Qué hacer este mes
Mientras Pro está en pruebas internas, tres movimientos concretos:
- Ejecuta tus evaluaciones contra 3.5 Flash esta semana. Está activo en la API de Gemini, Google AI Studio, Vertex, Antigravity y la aplicación Gemini bajo el ID de modelo
gemini-3.5-flash. Si Flash ya cubre tu carga de trabajo, es posible que no necesites Pro en absoluto. - Para cargas de trabajo de contexto largo o razonamiento complejo, mantente en Gemini 3.1 Pro por ahora. No migres hacia abajo a Flash solo porque es el modelo más nuevo — la regresión de 7.6 puntos en 128K es real. Espera a Pro.
- Configura tu prueba A/B de junio ahora. Define la evaluación de comparación Flash → Pro antes de que Pro llegue. La tentación de cambiar el día del lanzamiento es real; el valor de un benchmark reservado que ya hayas ejecutado contra Flash y 3.1 Pro es aún mayor.
Hasta que Pro llegue
Para cargas de trabajo del lado de LLM, el endpoint LLM de WaveSpeedAI te da acceso compatible con OpenAI a los modelos de texto de frontera actuales detrás de una única clave API. Cuando Gemini 3.5 Pro llegue en junio, espera poder compararlo bajo ese mismo endpoint en pocos días — junto a Flash y el resto de la alineación de texto de frontera.
Fuentes: Resumen de I/O 2026 de MacRumors, LLM Stats sobre Gemini 3.5 Flash, Reseña de Gemini 3.5 de Felloai, BusinessToday sobre Gemini Spark y 3.5.

