Gemini 3.5 Pro llegará el próximo mes — Lo que el lanzamiento de Flash ya nos dice

El día después del keynote de I/O 2026, la pregunta previa al keynote de si Google lanzaría “Gemini 3.5” o “Gemini 4.0” obtuvo respuesta. Es 3.5. Pero la parte más interesante es lo que Google realmente lanzó y lo que retuvo: Gemini 3.5 Flash llegó a disponibilidad general el 19 de mayo; Gemini 3.5 Pro “llegará el próximo mes.” La frase exacta de Sundar Pichai en el escenario: “Denos hasta el próximo mes para hacérselo llegar.”

Según los reportes, el público exhaló un quejido. Reacción razonable, pero la brecha también es más interesante de lo que parece. Flash ya supera a Gemini 3.1 Pro en los benchmarks que más importan a los desarrolladores — y regresa en un conjunto específico de benchmarks de razonamiento y contexto largo. El lanzamiento de Pro un mes después es casi con certeza la respuesta de Google a esa regresión. Esto es lo que el lanzamiento de Flash nos dice sobre lo que Pro realmente será.

Confirmado: lo que Google dijo sobre 3.5 Pro

Las declaraciones de Google en el escenario sobre Pro fueron mínimas. El conjunto completo de hechos confirmados:

Detalle	Fuente	Estado
Lanza “el próximo mes” (junio 2026)	Keynote de Pichai	Confirmado
Actualmente en pruebas internas	Keynote de Pichai	Confirmado
Compartirá el enfoque de codificación/agéntico de Flash	Mensajes de I/O	Confirmado
Números específicos de benchmark	—	No divulgados
Precios	—	No divulgados
Ventana de contexto	—	No divulgada
ID del modelo	—	No divulgado

Eso es todo. Sin benchmarks, sin precios, sin tarjeta de modelo. El lanzamiento de Pro es exactamente una declaración de intención y un cronograma.

Lo que los datos de Flash nos dicen sobre Pro

Aquí es donde se vuelve útil. Gemini 3.5 Flash se lanzó el mismo día con benchmarks completos, y la comparación con la generación anterior Gemini 3.1 Pro revela exactamente dónde es fuerte la nueva generación y dónde es débil.

Dónde Flash supera a Gemini 3.1 Pro

Benchmark	3.5 Flash	3.1 Pro	Delta
Terminal-Bench 2.1	76.2%	70.3%	+5.9
MCP Atlas	83.6%	78.2%	+5.4
Finance Agent v2	57.9%	43.0%	+14.9
GDPval-AA	1656 Elo	1314 Elo	+342

Todos son benchmarks de codificación y agénticos — las categorías donde Claude ha sido el predeterminado para desarrolladores. Flash ahora está más cerca de Claude en estos que lo que estaba el nivel Pro anterior. Eso es un cambio de producto significativo, no uno marginal.

Dónde Flash regresa vs Gemini 3.1 Pro

Benchmark	3.5 Flash	3.1 Pro	Delta
Humanity’s Last Exam	40.2%	44.4%	−4.2
ARC-AGI-2	72.1%	77.1%	−5.0
Contexto largo (128K)	77.3%	84.9%	−7.6

Estos tres son los exactos benchmarks donde esperarías que un nivel Pro se diferenciara. Razonamiento profundo. Reconocimiento de patrones abstractos. Recuperación de contexto largo. Los dos primeros ponen a prueba la profundidad; el tercero pone a prueba la recuperación a escala. Que Flash caiga 4-8 puntos en cada uno indica que la arquitectura de Flash realizó intercambios deliberados para alcanzar los números de velocidad y costo.

El lanzamiento de 3.5 Pro en junio es casi con certeza la respuesta de Google a esta lista exacta. La razón de existir de Pro es restaurar la ventaja en razonamiento y contexto largo que Flash cedió. Si Pro supera a 3.1 Pro en Humanity’s Last Exam y iguala a Flash en Terminal-Bench, es el modelo de frontera de producción más sólido. Si solo corrige la regresión a costa de la velocidad agéntica, es un posicionamiento diferente.

Lo que los precios de Flash implican para Pro

Flash se lanzó a $1.50 de entrada / $9.00 de salida por 1M de tokens en el nivel estándar — un 40% más barato que Gemini 3.1 Pro en ambos ejes. La entrada en caché es $0.15/1M, que es el número destacado para cargas de trabajo con mucha recuperación.

La lectura directa sobre los precios de Pro:

Si Pro se lanza a los precios de Gemini 3.1 Pro o superiores (~$2.50/$15/1M o más), está señalando que Pro está destinado como un nivel de razonamiento premium en lugar de un reemplazo de Flash.
Si Pro se lanza por debajo del precio de 3.1 Pro pero por encima de Flash, se posiciona como el “Flash más inteligente” predeterminado — misma superficie de producto, mayor capacidad, prima modesta.
Si Pro iguala los precios de Flash, eso sería inusual y pondría a Flash en la misma posición incómoda en la que Seedance 2.0 Fast se encuentra actualmente (ver nuestro avance de Seedance 2.1 / Mini para el problema análogo de colisión de niveles).

La primera opción es la más probable. Google está haciendo una apuesta estructural de que los clientes pagarán por la separación del nivel de razonamiento. El quejido del público sugiere que el mercado cree que Flash es suficientemente bueno y que Pro es innecesario; no sabremos si el mercado tiene razón hasta que los desarrolladores ejecuten sus propias evaluaciones contra la tarjeta de modelo de junio.

Otras cosas a vigilar en junio

Cuando se publique la tarjeta del modelo Pro, cuatro detalles importan:

¿Pro iguala a Flash en codificación (Terminal-Bench, MCP Atlas)? Si es así, Pro es un superconjunto estricto. Si no, estarás ejecutando dos endpoints — Flash para agentes, Pro para razonamiento — y el costo de integración aumenta.
Números de contexto largo. Si Pro restaura la ventaja de Gemini 3.1 Pro en 128K y se extiende a la misma ventana de contexto de 1M de tokens con la que Flash se lanza, esa es la señal más relevante para producción. Las cargas de trabajo con mucho RAG deben planificar su migración específicamente en este número.
Afirmaciones multimodales. Flash se lanzó con la misma comprensión de imagen/video que la línea 3.0. Si Pro se lanza con la integración de generación de video Gemini Omni (aún rumorada al 20 de mayo), esa es una historia de unificación que Google aún no puede contar.
Si Pro es un modelo de pensamiento. Los modelos de razonamiento recientes de Google se han lanzado con modos opcionales de “pensamiento” que intercambian latencia por precisión. Si 3.5 Pro activa el pensamiento por defecto o expone control por solicitud, eso afecta materialmente cómo lo usarías en producción.

Qué hacer este mes

Mientras Pro está en pruebas internas, tres movimientos concretos:

Ejecuta tus evaluaciones contra 3.5 Flash esta semana. Está activo en la API de Gemini, Google AI Studio, Vertex, Antigravity y la aplicación Gemini bajo el ID de modelo gemini-3.5-flash. Si Flash ya cubre tu carga de trabajo, es posible que no necesites Pro en absoluto.
Para cargas de trabajo de contexto largo o razonamiento complejo, mantente en Gemini 3.1 Pro por ahora. No migres hacia abajo a Flash solo porque es el modelo más nuevo — la regresión de 7.6 puntos en 128K es real. Espera a Pro.
Configura tu prueba A/B de junio ahora. Define la evaluación de comparación Flash → Pro antes de que Pro llegue. La tentación de cambiar el día del lanzamiento es real; el valor de un benchmark reservado que ya hayas ejecutado contra Flash y 3.1 Pro es aún mayor.

Hasta que Pro llegue

Para cargas de trabajo del lado de LLM, el endpoint LLM de WaveSpeedAI te da acceso compatible con OpenAI a los modelos de texto de frontera actuales detrás de una única clave API. Cuando Gemini 3.5 Pro llegue en junio, espera poder compararlo bajo ese mismo endpoint en pocos días — junto a Flash y el resto de la alineación de texto de frontera.

Fuentes: Resumen de I/O 2026 de MacRumors, LLM Stats sobre Gemini 3.5 Flash, Reseña de Gemini 3.5 de Felloai, BusinessToday sobre Gemini Spark y 3.5.

Confirmado: lo que Google dijo sobre 3.5 Pro

Lo que los datos de Flash nos dicen sobre Pro

Dónde Flash supera a Gemini 3.1 Pro

Dónde Flash regresa vs Gemini 3.1 Pro

Lo que los precios de Flash implican para Pro

Otras cosas a vigilar en junio

Qué hacer este mes

Hasta que Pro llegue

Artículos relacionados

Claude Fable 5 ya está disponible: 80,3% en SWE-Bench Pro, precios 2× Opus 4.8, gratis hasta el 22 de junio

Gemini 3.5 Flash ya disponible — un modelo de nivel Flash lidera los benchmarks del nivel Pro en agentes

Gemini Omni Flash ha llegado: video multimodal de 10 segundos, marca de agua SynthID, edición de audio retenida

Gemini 4.0 en Google I/O 2026: Qué está confirmado, qué viene de fuentes anónimas y qué deben vigilar realmente los desarrolladores

Los Demos de Gemini Omni Acaban de Filtrarse — Esto Es Lo Que Realmente Hace el Nuevo Modelo de Video de Google

El misterioso modelo de video 'Omni' de Google: qué nos revela la filtración de la interfaz de Gemini antes del I/O 2026