← 블로그

Gemini 3.5 Pro, 다음 달 출시 예정 — Flash 릴리즈가 이미 알려주는 것들

Google은 I/O 2026에서 Gemini 3.5 Flash를 출시하고 Pro는 6월로 미뤘습니다. Flash는 코딩 및 에이전트 벤치마크에서 이미 Gemini 3.1 Pro를 능가하지만 복잡한 추론에서는 퇴보했습니다 — 바로 Pro가 메워야 할 격차입니다. 알려진 것, 알려지지 않은 것, 그리고 계획 방법을 정리했습니다.

By WaveSpeedAI 5 min read

I/O 2026 기조연설 다음 날, Google이 “Gemini 3.5”를 출시할지 “Gemini 4.0”을 출시할지에 대한 사전 질문에 답이 나왔다. 3.5다. 하지만 더 흥미로운 부분은 Google이 실제로 무엇을 출시했고 무엇을 보류했는가다: Gemini 3.5 Flash는 5월 19일 일반 출시(GA)로 배포됐고, Gemini 3.5 Pro는 “다음 달 출시 예정”이다. 무대에서 Sundar Pichai의 정확한 발언은 이렇다: “다음 달까지 기다려 주십시오.”

청중은 야유했다고 전해진다. 충분히 이해할 수 있는 반응이지만, 이 간격은 겉보기보다 훨씬 흥미롭다. Flash는 이미 개발자들에게 가장 중요한 벤치마크에서 Gemini 3.1 Pro를 능가하고 있다 — 그러면서 동시에 특정 추론 및 장문 컨텍스트 벤치마크에서는 후퇴하고 있다. Pro가 한 달 뒤에 출시되는 것은 거의 확실히 그 후퇴에 대한 Google의 답변이다. Flash 출시 결과가 Pro가 실제로 어떤 모습일지에 대해 무엇을 말해주는지 살펴보자.

확인됨: Google이 3.5 Pro에 대해 말한 것

무대에서 Pro에 대한 Google의 발언은 최소한이었다. 확인된 사실의 전체 목록:

세부 사항출처상태
”다음 달”(2026년 6월) 출시Pichai 기조연설확인됨
현재 내부 테스트 중Pichai 기조연설확인됨
Flash의 코딩/에이전트 중심을 공유할 예정I/O 메시지확인됨
구체적인 벤치마크 수치미공개
가격미공개
컨텍스트 창미공개
모델 ID미공개

이것이 전부다. 벤치마크도, 가격도, 모델 카드도 없다. Pro 출시는 정확히 하나의 의도 표명과 하나의 일정이다.

Flash 데이터가 Pro에 대해 말해주는 것

여기서부터 유용해진다. Gemini 3.5 Flash는 같은 날 전체 벤치마크와 함께 출시됐으며, 이전 세대 Gemini 3.1 Pro와의 비교를 통해 새 세대가 어디서 강하고 어디서 약한지가 정확히 드러난다.

Flash가 Gemini 3.1 Pro를 앞서는 부분

벤치마크3.5 Flash3.1 Pro차이
Terminal-Bench 2.176.2%70.3%+5.9
MCP Atlas83.6%78.2%+5.4
Finance Agent v257.9%43.0%+14.9
GDPval-AA1656 Elo1314 Elo+342

이것들은 모두 코딩 및 에이전트 벤치마크다 — Claude가 개발자 기본값으로 자리잡아온 분야다. Flash는 이제 이전 Pro 티어보다 Claude에 더 가까워졌다. 이것은 의미 있는 제품 변화이지, 미미한 변화가 아니다.

Flash가 Gemini 3.1 Pro 대비 후퇴하는 부분

벤치마크3.5 Flash3.1 Pro차이
Humanity’s Last Exam40.2%44.4%−4.2
ARC-AGI-272.1%77.1%−5.0
장문 컨텍스트 (128K)77.3%84.9%−7.6

이 세 가지는 Pro 티어가 차별화될 것으로 기대되는 바로 그 벤치마크다. 어려운 추론, 추상적 패턴 매칭, 장문 컨텍스트 검색. 앞의 두 가지는 깊이를 시험하고, 세 번째는 대규모 회상 능력을 시험한다. Flash가 각 항목에서 4~8점 하락한 것은 Flash 아키텍처가 속도와 비용 수치를 달성하기 위해 의도적인 트레이드오프를 했음을 의미한다.

6월의 3.5 Pro 출시는 거의 확실히 바로 이 목록에 대한 Google의 답변이다. Pro가 존재해야 하는 이유는 Flash가 포기한 추론 및 장문 컨텍스트 우위를 회복하는 것이다. Pro가 Humanity’s Last Exam에서 3.1 Pro를 넘어서면서 Terminal-Bench에서 Flash와 동등하다면, 현존하는 가장 강력한 프로덕션 프론티어 모델이 된다. 에이전트 속도를 희생하면서 회귀만 수정한다면, 다른 포지셔닝이 된다.

Flash 가격이 Pro에 대해 암시하는 것

Flash는 표준 티어 기준 입력 $1.50 / 출력 $9.00 per 1M 토큰으로 출시됐다 — 양쪽 모두 Gemini 3.1 Pro보다 40% 저렴하다. 캐시된 입력은 $0.15/1M으로, 검색 집약적 워크로드의 핵심 수치다.

Pro 가격에 대한 직접적인 해석:

  • Pro가 Gemini 3.1 Pro 가격 이상으로 출시된다면 (약 $2.50/$15/1M 이상), Flash 대체가 아닌 프리미엄 추론 티어로 포지셔닝한다는 신호다.
  • Pro가 3.1 Pro보다 낮지만 Flash보다 높은 가격으로 출시된다면, “더 스마트한 Flash”로 포지셔닝된 것 — 같은 제품 표면, 더 높은 역량, 적당한 프리미엄.
  • Pro가 Flash와 동일한 가격이라면, 이례적인 일이 될 것이고 Flash를 현재 Seedance 2.0 Fast가 처한 것과 같은 어색한 위치에 놓게 된다 (유사한 티어 충돌 문제는 Seedance 2.1 / Mini 프리뷰 참조).

첫 번째 옵션이 가장 가능성이 높다. Google은 고객들이 추론 티어 분리에 비용을 지불할 것이라는 구조적 베팅을 하고 있다. 청중의 야유는 시장이 Flash로도 충분하고 Pro는 불필요하다고 생각한다는 것을 시사한다. 빌더들이 6월 모델 카드에 대해 자체 평가를 실행하기 전까지는 시장이 맞는지 알 수 없다.

6월에 주목할 다른 사항들

Pro 모델 카드가 공개될 때, 네 가지 구체적인 사항이 중요하다:

  1. Pro가 코딩(Terminal-Bench, MCP Atlas)에서 Flash와 동등한가? 그렇다면, Pro는 엄격한 상위 집합이다. 그렇지 않다면, 에이전트용 Flash와 추론용 Pro라는 두 개의 엔드포인트를 운영하게 되며 통합 비용이 증가한다.
  2. 장문 컨텍스트 수치. Pro가 128K에서 Gemini 3.1 Pro 수준을 회복하면서 Flash가 제공하는 동일한 1M 토큰 컨텍스트 창으로 확장된다면, 가장 프로덕션 관련성 높은 신호다. RAG 집약적 워크로드는 이 수치를 기반으로 마이그레이션을 계획해야 한다.
  3. 멀티모달 주장. Flash는 3.0 라인과 동일한 이미지/비디오 이해 능력으로 출시됐다. Pro가 Gemini Omni 비디오 생성 통합과 함께 출시된다면 (5월 20일 기준으로 여전히 소문 수준), Google이 아직 말하지 못한 통합 스토리가 된다.
  4. Pro가 씽킹 모델인지 여부. Google의 최근 추론 모델들은 레이턴시를 정확도와 교환하는 선택적 “씽킹” 모드와 함께 출시됐다. 3.5 Pro가 씽킹 기본값으로 출시되거나 요청별 제어를 제공한다면, 프로덕션에서 사용 방식에 실질적인 영향을 미친다.

이번 달에 할 일

Pro가 내부 테스트 중인 동안, 세 가지 구체적인 행동:

  1. 이번 주에 3.5 Flash에 대한 자체 평가를 실행하라. Gemini API, Google AI Studio, Vertex, Antigravity, 그리고 모델 ID gemini-3.5-flash로 Gemini 앱에서 라이브로 사용 가능하다. Flash가 이미 워크로드를 커버한다면, Pro가 전혀 필요 없을 수도 있다.
  2. 장문 컨텍스트 또는 어려운 추론 워크로드의 경우, 지금은 Gemini 3.1 Pro를 유지하라. 단순히 최신 모델이라는 이유만으로 Flash로 다운그레이드하지 마라 — 128K에서 7.6점 후퇴는 실재한다. Pro를 기다려라.
  3. 지금 6월 A/B 테스트를 설계하라. Pro가 출시되기 전에 Flash → Pro 비교 평가 기준을 정의하라. 출시일에 전환하고 싶은 유혹은 실재하지만, 이미 Flash와 3.1 Pro에 대해 실행한 보유 벤치마크의 가치는 더 실재한다.

Pro가 출시될 때까지

LLM 측 워크로드의 경우, WaveSpeedAI LLM 엔드포인트는 단일 API 키 뒤에 현재 프론티어 텍스트 모델에 대한 OpenAI 호환 접근을 제공한다. Gemini 3.5 Pro가 6월에 출시되면, 며칠 내로 Flash 및 나머지 프론티어 텍스트 라인업과 함께 동일한 엔드포인트에서 비교할 수 있을 것이다.