Gemini 3.5 Pro выходит в следующем месяце — что уже говорит нам релиз Flash

Google представила Gemini 3.5 Flash на I/O 2026 и отложила Pro до июня. Flash уже превосходит Gemini 3.1 Pro в тестах по программированию и агентным задачам, но регрессировал в сложных рассуждениях — именно этот разрыв должна закрыть версия Pro. Что известно, что нет и как планировать.

By WaveSpeedAI 6 min read

На следующий день после основного доклада I/O 2026 был получен ответ на вопрос, заданный накануне: Google выпустит «Gemini 3.5» или «Gemini 4.0»? Ответ — 3.5. Но куда интереснее то, что Google реально запустил, а что придержал: Gemini 3.5 Flash вышел в общий доступ 19 мая; Gemini 3.5 Pro «выйдет в следующем месяце». Точная фраза Сундара Пичаи со сцены: «Дайте нам ещё месяц, и он будет у вас.»

Зал, по слухам, застонал. Реакция понятная, однако разрыв оказывается интереснее, чем кажется. Flash уже превосходит Gemini 3.1 Pro на бенчмарках, наиболее важных для разработчиков, — и при этом регрессирует на конкретном наборе тестов на рассуждения и работу с длинным контекстом. Выход Pro месяцем позже — почти наверняка ответ Google именно на этот регресс. Вот что запуск Flash говорит нам о том, каким на самом деле будет Pro.

Подтверждено: что Google сказал о 3.5 Pro

Заявления Google о Pro на сцене были минимальными. Полный набор подтверждённых фактов:

ДетальИсточникСтатус
Выход «в следующем месяце» (июнь 2026)Keynote ПичаиПодтверждено
Сейчас находится на внутреннем тестированииKeynote ПичаиПодтверждено
Разделит акцент Flash на кодинг и агентные задачиСообщения с I/OПодтверждено
Конкретные значения бенчмарковНе раскрыто
ЦенообразованиеНе раскрыто
Контекстное окноНе раскрыто
Идентификатор моделиНе раскрыто

Вот и всё. Никаких бенчмарков, цен, карточки модели. Релиз Pro — это ровно одно заявление о намерениях и один временной ориентир.

Что данные Flash говорят нам о Pro

Здесь начинается самое интересное. Gemini 3.5 Flash вышел в тот же день с полным набором бенчмарков, и сравнение с Gemini 3.1 Pro предыдущего поколения точно показывает, где новое поколение сильно, а где слабо.

Где Flash превосходит Gemini 3.1 Pro

Бенчмарк3.5 Flash3.1 ProДельта
Terminal-Bench 2.176.2%70.3%+5.9
MCP Atlas83.6%78.2%+5.4
Finance Agent v257.9%43.0%+14.9
GDPval-AA1656 Elo1314 Elo+342

Всё это бенчмарки на кодинг и агентные задачи — категории, где Claude традиционно был выбором разработчиков по умолчанию. Flash теперь ближе к Claude в этих категориях, чем был предыдущий уровень Pro. Это существенное продуктовое изменение, а не маргинальное.

Где Flash регрессирует относительно Gemini 3.1 Pro

Бенчмарк3.5 Flash3.1 ProДельта
Humanity’s Last Exam40.2%44.4%−4.2
ARC-AGI-272.1%77.1%−5.0
Длинный контекст (128K)77.3%84.9%−7.6

Именно эти три теста — те самые, на которых вы ожидаете дифференциации уровня Pro. Сложные рассуждения. Абстрактное распознавание паттернов. Извлечение информации из длинного контекста. Первые два проверяют глубину; третий — масштаб извлечения. Падение Flash на 4–8 пунктов по каждому говорит о том, что архитектура Flash намеренно шла на компромиссы ради скорости и стоимости.

Выход 3.5 Pro в июне — это почти наверняка ответ Google именно на этот список. Смысл существования Pro — восстановить превосходство в рассуждениях и работе с длинным контекстом, которое Flash уступил. Если Pro окажется выше 3.1 Pro на Humanity’s Last Exam и сравняется с Flash на Terminal-Bench — это сильнейшая производственная фронтирная модель. Если же он лишь исправит регресс ценой агентной скорости — это другое позиционирование.

Что ценообразование Flash говорит нам о Pro

Flash вышел по цене $1.50 за входные / $9.00 за выходные данные на 1M токенов на стандартном уровне — на 40% дешевле Gemini 3.1 Pro по обоим параметрам. Кэшированный ввод — $0.15/1M, что является ключевой цифрой для нагрузок с интенсивным извлечением данных.

Логичные выводы о ценообразовании Pro:

  • Если Pro выйдет по цене Gemini 3.1 Pro или выше (~$2.50/$15/1M и выше), это сигнал: Pro позиционируется как премиальный уровень для рассуждений, а не замена Flash.
  • Если Pro выйдет дешевле 3.1 Pro, но дороже Flash, он занимает нишу «более умного Flash» — та же продуктовая поверхность, более высокие возможности, небольшая наценка.
  • Если Pro совпадёт по цене с Flash, это будет необычно и поставит Flash в то же неловкое положение, в котором сейчас находится Seedance 2.0 Fast (см. наш предварительный обзор Seedance 2.1 / Mini с аналогичной проблемой коллизии уровней).

Первый вариант наиболее вероятен. Google делает стратегическую ставку на то, что клиенты заплатят за разделение на уровни по качеству рассуждений. Стон зала говорит о том, что рынок считает Flash достаточно хорошим, а Pro — излишним; правы ли участники рынка, мы узнаем лишь тогда, когда разработчики запустят собственные оценки на карточке июньской модели.

Что ещё отслеживать в июне

Когда выйдет карточка модели Pro, важны четыре конкретных момента:

  1. Сравняется ли Pro с Flash на задачах кодинга (Terminal-Bench, MCP Atlas)? Если да — Pro является строгим надмножеством. Если нет — придётся использовать два эндпойнта: Flash для агентных задач, Pro для рассуждений — и интеграционные затраты вырастут.
  2. Показатели длинного контекста. Если Pro восстановит преимущество Gemini 3.1 Pro при 128K токенах и расширит его до того же 1M-токенного контекстного окна, с которым вышел Flash, — это наиболее значимый сигнал для производственных задач. Нагрузки с активным использованием RAG должны планировать миграцию именно на основе этой цифры.
  3. Заявления о мультимодальности. Flash вышел с тем же пониманием изображений и видео, что и линейка 3.0. Если Pro выйдет с интеграцией генерации видео Gemini Omni (по состоянию на 20 мая всё ещё остающейся слухом), это станет историей объединения, которую Google пока не может рассказать.
  4. Является ли Pro моделью с мышлением. Недавние модели рассуждений Google выходили с опциональными режимами «мышления», которые обменивают задержку на точность. Если 3.5 Pro по умолчанию включает мышление или предоставляет управление на уровне запроса, это существенно влияет на то, как вы будете использовать его в продакшне.

Что делать в этом месяце

Пока Pro находится на внутреннем тестировании, три конкретных шага:

  1. Запустите свои оценки на 3.5 Flash на этой неделе. Модель доступна в Gemini API, Google AI Studio, Vertex, Antigravity и приложении Gemini под идентификатором gemini-3.5-flash. Если Flash уже покрывает вашу нагрузку, Pro вам может и не понадобиться.
  2. Для нагрузок с длинным контекстом или сложными рассуждениями пока оставайтесь на Gemini 3.1 Pro. Не переходите на Flash только потому, что это новейшая модель — регресс на 7.6 пункта при 128K токенах реален. Подождите Pro.
  3. Настройте A/B-тест на июнь прямо сейчас. Определите оценку для сравнения Flash → Pro до выхода Pro. Соблазн переключиться в день запуска будет велик; ценность отложенного бенчмарка, который вы уже прогнали на Flash и 3.1 Pro, ещё больше.

До выхода Pro

Для LLM-нагрузок эндпойнт WaveSpeedAI LLM предоставляет совместимый с OpenAI доступ к актуальным фронтирным текстовым моделям через единый API-ключ. Когда в июне выйдет Gemini 3.5 Pro, ожидайте возможности сравнить его через тот же эндпойнт в течение нескольких дней — вместе с Flash и остальной линейкой фронтирных текстовых моделей.

Источники: Обзор I/O 2026 от MacRumors, LLM Stats о Gemini 3.5 Flash, Обзор Gemini 3.5 от Felloai, BusinessToday о Gemini Spark и 3.5.

Поделиться