Gemini 3.5 Proは来月登場——Flashリリースが既に示すもの
GoogleはI/O 2026でGemini 3.5 Flashを公開し、Proは6月に持ち越した。FlashはすでにコーディングとエージェントベンチマークでGemini 3.1 Proを上回るが、高度な推論では後退しており、そこがProが埋めるべきギャップだ。現時点での既知事項・未確認事項と今後の計画指針をまとめる。
I/O 2026基調講演の翌日、Googleが「Gemini 3.5」を出すのか「Gemini 4.0」を出すのかという事前の問いに答えが出た。答えは3.5だ。しかし、より興味深いのはGoogleが実際に発表したものと、保留にしたものだ。Gemini 3.5 Flashは5月19日に一般提供を開始し、Gemini 3.5 Proは「来月提供予定」となっている。 Sundar Pichai氏がステージ上で述べた言葉を正確に引用すれば、「来月まで待っていただきたい」というものだ。
会場からは不満の声が上がったと伝えられている。もっともな反応だが、この差は見た目以上に興味深い。Flashは最も重要なベンチマークでGemini 3.1 Proをすでに超えている——しかし一方で、特定の推論・長文コンテキストのベンチマークでは後退している。1か月遅れでProを出荷することは、ほぼ間違いなくGoogleがその後退に対して用意した答えだ。Flashのローンチを見れば、Proが実際にどんなものになるかがわかる。
確認済み:Googleが3.5 Proについて述べたこと
Proについてのステージ上での発言は最小限だった。確認された事実の全容:
| 詳細 | 情報源 | 状態 |
|---|---|---|
| 「来月」(2026年6月)ローンチ | Pichai基調講演 | 確認済み |
| 現在、社内テスト中 | Pichai基調講演 | 確認済み |
| Flashのコーディング/エージェント重視を共有 | I/Oメッセージング | 確認済み |
| 具体的なベンチマーク数値 | — | 非公開 |
| 価格 | — | 非公開 |
| コンテキストウィンドウ | — | 非公開 |
| モデルID | — | 非公開 |
以上だ。ベンチマークも、価格も、モデルカードも存在しない。Proのリリースは、意図の表明と1つのタイムラインだけだ。
Flashのデータが語るProの姿
ここからが有益な部分だ。Gemini 3.5 Flashは同日に完全なベンチマーク付きでローンチされており、前世代のGemini 3.1 Proとの比較から、新世代の強みと弱みが正確に読み取れる。
FlashがGemini 3.1 Proを超える領域
| ベンチマーク | 3.5 Flash | 3.1 Pro | 差分 |
|---|---|---|---|
| Terminal-Bench 2.1 | 76.2% | 70.3% | +5.9 |
| MCP Atlas | 83.6% | 78.2% | +5.4 |
| Finance Agent v2 | 57.9% | 43.0% | +14.9 |
| GDPval-AA | 1656 Elo | 1314 Elo | +342 |
これらはすべてコーディングとエージェントのベンチマークだ——Claudeが開発者のデフォルト選択だったカテゴリーである。Flashは、これらの指標において、前世代のProティアよりもClaudeに近い位置に来ている。 これは些細な変化ではなく、意味のある製品上の変化だ。
FlashがGemini 3.1 Proより後退する領域
| ベンチマーク | 3.5 Flash | 3.1 Pro | 差分 |
|---|---|---|---|
| Humanity’s Last Exam | 40.2% | 44.4% | −4.2 |
| ARC-AGI-2 | 72.1% | 77.1% | −5.0 |
| 長文コンテキスト(128K) | 77.3% | 84.9% | −7.6 |
この3つは、Proティアが差別化を図ることが期待されるまさにベンチマークだ。難しい推論、抽象的なパターンマッチング、長文コンテキストの検索。前の2つは深さを問い、3つ目は大規模な想起を問う。Flashがそれぞれ4〜8ポイント下落しているのは、Flashアーキテクチャがスピードとコストの数値を出荷するために意図的なトレードオフを行ったことを示している。
6月の3.5 Proのローンチは、ほぼ確実にこのリストに対するGoogleの答えだ。 Proの存在意義は、Flashが手放した推論と長文コンテキストのリードを取り戻すことにある。ProがHumanity’s Last ExamでGemini 3.1 Proを上回りかつTerminal-BenchでFlashに匹敵するなら、それは最強の本番向けフロンティアモデルだ。もしFlashのエージェント速度を犠牲にして後退を修正するだけなら、それは異なるポジショニングとなる。
Flashの価格が示すProへの示唆
Flashは標準ティアで入力$1.50 / 出力$9.00 / 100万トークンでローンチされた——両軸ともGemini 3.1 Proより40%安い。キャッシュ済み入力は$0.15/100万トークンで、これが検索重視のワークロードにとってのヘッドライン数値だ。
Proの価格についての素直な見方:
- ProがGemini 3.1 Proの価格以上でローンチする場合(〜$2.50/$15/100万トークン以上)、それはProがFlashの代替ではなくプレミアム推論ティアとして位置づけられていることを示す。
- Proが3.1 Proより安くFlashより高い価格でローンチする場合、それはデフォルトの「より賢いFlash」として位置づけられる——同じ製品サーフェス、より高い能力、適度なプレミアム。
- ProがFlashと同じ価格でローンチする場合、それは異例で、現在Seedance 2.0 Fastが置かれているのと同じ居心地の悪い状況(類似のティア競合問題についてはSeedance 2.1 / Miniのプレビューを参照)にFlashを追い込むことになる。
最初の選択肢が最も可能性が高い。Googleは顧客が推論ティアの分離に対して対価を払うという構造的な賭けをしている。会場の不満の声は、市場がFlashで十分だしProは不要だと考えていることを示唆している。6月のモデルカードに対して開発者が独自の評価を実行するまで、市場が正しいかどうかはわからない。
6月に注目すべき他のこと
ProのモデルカードがリリースされたときB、4つの具体的な点が重要だ:
- ProはコーディングでFlashに匹敵するか(Terminal-Bench、MCP Atlas)? もしそうなら、ProはFlashの厳密な上位互換だ。そうでなければ、エージェント用にFlashと推論用にProの2つのエンドポイントを運用することになり、統合コストが上がる。
- 長文コンテキストの数値。 Proが128KでGemini 3.1 Proのリードを取り戻しかつFlashが提供する同じ100万トークンのコンテキストウィンドウに拡張されれば、それは本番環境にとって最も重要なシグナルだ。RAG重視のワークロードは、この数値を基に移行計画を立てるべきだ。
- マルチモーダルの主張。 Flashは3.0ラインと同じ画像/動画理解能力でローンチした。もしProがGemini Omniの動画生成統合(5月20日現在、まだ噂の段階)とともに出荷されれば、それはGoogleがまだ語れていない統合のストーリーになる。
- Proは思考モデルか否か。 Googleの最近の推論モデルは、レイテンシと引き換えに精度を高める「思考」モードをオプションとして搭載してきた。3.5 Proが思考オン状態をデフォルトにするか、リクエストごとの制御を公開するなら、本番での使い方に実質的な影響を与える。
今月やるべきこと
Proが社内テスト中の間に、具体的な3つの行動をとろう:
- 今週中に3.5 Flashで自分の評価を実行する。 Gemini API、Google AI Studio、Vertex、Antigravity、Geminiアプリでモデル ID
gemini-3.5-flashとしてライブ公開されている。Flashがすでにあなたのワークロードをカバーしているなら、Proは必要ないかもしれない。 - 長文コンテキストや難しい推論のワークロードには、今のところGemini 3.1 Proを使い続けよう。 最新モデルだからといってFlashへ下方移行しないこと——128Kでの7.6ポイントの後退は現実のものだ。Proを待て。
- 6月のA/Bテストを今設定しておく。 ProがリリースされるBefore、Flash → Proの比較評価を定義しておこう。ローンチ当日に切り替えたくなる誘惑は現実のものだが、FlashとGemini 3.1 Proに対してすでに実行済みの保留ベンチマークの価値はそれ以上に現実的だ。
Proがリリースされるまで
LLM側のワークロードについては、WaveSpeedAI LLMエンドポイントが単一のAPIキーで現在のフロンティアテキストモデルへのOpenAI互換アクセスを提供している。Gemini 3.5 Proが6月にリリースされたら、Flash や他のフロンティアテキストラインナップとともに、数日以内に同じエンドポイントで比較できるようになる予定だ。
