GPT-5.6がOpenAIのCodexログに突如登場——これが実際に意味すること
OpenAIのCodexロールアウトログにある1件のルーティングエントリがGPT-5.6を指していた。Polymarketでは6月30日リリースの確率が89%に達している。確認済みの情報、ノイズに過ぎない情報、そしてゴブリン事件がテストをこれほど加速させている理由を解説する。
GPT-5.5がリリースされてから3週間後、GPT-5.6が浮上した。正式ローンチとして、システムカードとして、開発者向け発表としてではなく——OpenAIのCodexバックエンドログに存在したロールアウトマッピングの1エントリとして。研究者のHaiderがそれを発見したが、その後のセッションファイルからは消えていた。2026年5月13日時点で、Polymarketは6月30日までの公開リリース確率を89%としている。
たった1行のログに、それほど大きな意味を持たせることができるのか。実際に証拠が示すもの、示さないもの、そして——さらに興味深いことに——GPT-5.6のテストがGPT-5.4→GPT-5.5サイクルよりも速く進んでいる理由について整理する。最後の問いの短い答えには、「ゴブリン」という言葉が関係している。
実際に何が確認されたか
発見の経緯: OpenAIのCodexロールアウトのほとんどが推論リクエストをgpt-5.5にマッピングしていた中、ルーティングマッピングの1エントリにgpt-5.6への参照があった。そのエントリはしばらく再現可能だったが、その後消滅し——後続のセッションファイルではあらゆる箇所でgpt-5.5のみが表示されるようになった。これを報告したHaiderは、意図的な開示というより「バグに近い」と表現した。
BigGoのレポートはこれを実トラフィックを用いたバックエンドカナリアテストと評している——より広範なロールアウト前にパフォーマンスと動作を測定するため、実験的ビルドに少量のプロダクションリクエストをルーティングする標準的な手法だ。CodexのInternalマッピングが一時的に名前を露出させた事実は、GPT-5.6の出荷準備が整っていることを意味しない。実験的ビルドが存在し、実際のワークロードに対して測定されていることを示すにすぎない。
このログエントリから読み取れる2つの具体的な事実:
- GPT-5.6はCodex形式のプロンプトを受け付けられる実行可能な成果物として存在する。これは「トレーニングランが進行中」という段階を超えた、意味のある技術的マイルストーンだ。
- Codexのロールアウトインフラストラクチャにワイヤリングされている。これは、エージェント型/コーディング領域が主要な評価ターゲットであることを示唆しており、GPT-5.5がOpenAIの最強エージェント型コーディングモデルとしてポジショニングされていること(システムカードのTerminal-Bench 2.0スコア82.7%)と一致している。
このエントリから読み取れない2つの具体的な事実:
- パラメータ数、トレーニングデータ、アーキテクチャの変更については何もわからない。 ログは名前であり、設定ではない。
- リリース時期については何もわからない。 大規模ラボではカナリアエントリが常に現れては消える。Polymarketの89%という6月30日リリース予測はコミュニティの期待を示す実際のシグナルだが——市場は今年、モデルのリリース日予測を何度も間違えてきた。
テストが速く進んでいる理由: ゴブリン問題
興味深いコンテキストはログエントリそのものではない。GPT-5.5に具体的かつ最近公表された、名前のつきアラインメント失敗があり、GPT-5.6はそれを修正するためにトレーニングされているとほぼ確実に考えられる点だ。
2026年4月30日、OpenAIはWhere the Goblins Came Fromを公開した。GPT-5.5の奇妙な動作に関するポストモーテムだ: モデルがゴブリン、グレムリン、アライグマ、トロール、オーガ、ハトへの統計的に有意な固執を示すようになっていた。散発的にではなく——数億件のレスポンスにわたって測定可能に。ポストモーテムの数値は以下の通りだ:
| 指標 | 値 |
|---|---|
| 「Nerdy」ペルソナにおけるゴブリン言及数(GPT-5.2ベースライン比) | +3,881% |
| Nerdyペルソナからの全ゴブリン言及のシェア | 66.7% |
| NerdyペルソナのChatGPTトラフィックシェア | 2.5% |
| GPT-5.1以降のゴブリン言及増加率 | +175% |
| 同期間のグレムリン言及増加率 | +52% |
| 強化学習がゴブリン/グレムリン出力をより高く評価したデータセット割合 | 76.2% |
何が起きたか: パーソナリティカスタマイズトレーニング中、OpenAIの報酬モデルがレスポンススタイルを「Nerdy」とした場合に、生き物の比喩に対して系統的に高いスコアを付与した。Nerdyペルソナはトラフィックのごく一部(2.5%)だったが、報酬の形状が漏れ出した。OpenAI自身の表現を借りれば: 「強化学習は、学習した動作がそれを生み出した条件に綺麗にスコープされたままであることを保証しない。」
ゴブリンを多用したレスポンスが1つのペルソナで高いスコアを得始めると、それらはロールアウトプールに選ばれた。そのロールアウトは次のトレーニングサイクルの教師あり微調整データとしてリサイクルされた。動作が正規化された。誰かが気づいた時には、GPT-5.5はすでにトレーニングを開始しており、汚染はアライグマ、トロール、オーガ、ハトといった複数のダウンストリームの「tic-word」に広がっていた。
緊急の修正は、Codexの指示に4回繰り返されるシステムプロンプトパッチだった: 「ゴブリン、グレムリン、アライグマ、トロール、オーガ、ハト、またはその他の動物や生き物については、ユーザーのクエリに絶対的かつ明確に関連する場合を除き、決して話さないこと。」 最先端のラボが本番環境で4回繰り返されるキーワードブロックを出荷しなければならないという事実は、報酬によって形成された動作がいかに漏れやすいかを雄弁に物語っている。
OpenAIはまた、2026年3月にNerdyパーソナリティオプションを完全に削除した。
これがGPT-5.6にとって具体的に意味すること
ゴブリン事件は単に恥ずかしいものではなかった——それは報酬形成が小規模なトレーニング条件からモデル全体の動作汚染を引き起こし得ること、そしてその汚染がSFTデータパイプラインを通じてモデルバージョンをまたいで持続することの具体的な実証だ。これはシステムプロンプトでパッチを当てられるバグではない。RLHFフィードバックループがトレーニングランをまたいで複合化する方法に関するアーキテクチャ的な問題だ。
そのため、GPT-5.5がリリースされてから3週間後に新しいモデル名へのカナリアトラフィックが始まった場合、最も安全な解釈は:
GPT-5.6は、ゴブリン事件後に再設計された報酬監査パイプラインでトレーニングされた最初のモデルバージョンだ。 そのために必要な技術的作業——過去の報酬シグナルの監査、汚染されたSFTデータの特定、報酬モデルの再トレーニング——は、まさにリリースサイクルを圧縮するタイプの作業だ。
OpenAIが通常語る機能(より長いコンテキスト、より高速な推論、より良いツール使用)はその下流にある。実際のGPT-5.6の作業は、パターンが持続するなら、地味なものだ: クリーンな報酬シグナル、より厳格なペルソナ分離保証、汚染されたロールアウトをリサイクルしないSFTパイプライン。これらはコーディング評価の向上ほどベンチマークを際立たせるものではないが、GPT-5.7がゴブリンを受け継ぐかどうかを決定する作業だ。
合理的に期待できること
GPT-5.6が実際に搭載するものについての現実的な予測:
- GPT-5.5と同じ一般的な能力プロファイル — コーディング、エージェント型ツール使用、マルチモーダル — 飛躍的ではなく漸進的な改善。
- 報酬監査とペルソナ分離に関する新しいシステムカードセクション。 OpenAIがそう呼ぶかどうかにかかわらず、モデルカードに「改善された報酬キャリブレーション」または類似の表現が登場すると予想される。
- 残存するtic-word痕跡の除去 — 新モデルの出力に対して同じゴブリン頻度分析を実行することで検証可能。
- 再設計された形でのパーソナリティカスタマイズの復活の可能性。 Nerdyは3月に削除された。GPT-5.6がペルソナコントロールを復活させてリリースされた場合、それは報酬問題が表面的な対処ではなく構造的に修正されたことの強いシグナルだ。
期待すべきでないこと:
- 大規模なアーキテクチャ変更。GPT-5.5からGPT-5.6へのギャップは3週間のカナリアシグナルだ。それはファウンデーションの再構築には不十分だ。
- 価格またはAPI表面の変更。GPT-5.5は1Mトークンあたり$1.25/$10で安定したばかりだ。OpenAIがマイナーバージョンで価格を変更することはめったにない。
- 差し迫った公開リリース。Polymarketの89%-by-June-30予測は妥当だが確実性はない——カナリアシグナルは公開ロールアウトの数ヶ月前から存在し続けることがある。
今日ビルダーがすべきこと
GPT-5.6がプレリリース中の間の3つの具体的なアクション:
- 自分のプロダクションGPT-5.5出力に対してゴブリン頻度テストを実行する。 論理的に正当化されないコンプリーションでゴブリン/グレムリン/トロールの言及が>0.5%見られる場合、システムプロンプトパッチを通じて問題がまだ漏れ出しているという測定可能なシグナルがある。これはGPT-5.6がリリースされた日に評価するためのベンチマークにもなる。
gpt-5.5-latestではなく現在のgpt-5.5エンドポイントに固定する。 明示的なバージョンにピニングすることで、GPT-5.6が昇格された瞬間にサイレントにロールオーバーされるのを防ぐ。明示的なバージョニングのコストはほぼゼロだが、プロダクションでの未発表のモデル変更のコストは大きくなり得る。- GPT-5.6がリリースされる前に評価方法を決定する。 評価が「いくつか質問して出力が良く見えるか確認する」というものであれば、ノイズが得られる。評価がすでにGPT-5.5の数値を持つホールドアウトベンチマークであれば、シグナルが得られる。
今後1週間
Polymarketが正しく6月30日までに公開リリースが行われるなら、追跡すべきプレリリース活動が6週間ある。注目すべきシグナル:
- さらなるカナリアログの出現 — 実験的ビルドが定常的な評価トラフィックに入ると、リークは複合化する。
- OpenAIによる報酬監査に関する2番目のブログ記事。 4月30日のゴブリンポストモーテムは2部構成の物語の前半のように読めた。後半は彼らが何をしたか、つまりGPT-5.6のナラティブだ。
- 新しいシステムカード。 GPT-5.5のシステムカードとデプロイメント安全ハブエントリはモデルと同時に公開された。GPT-5.6でも同様のことが予想される。
- Codexのアップデート。 GPT-5.6の名前を露出させた同じログが、公開バージョンバンプが最初に表示される場所になるだろう。
現時点では: 1行のログ、1つのPolymarket数値、そしてこのサイクルが前回より速く動いている理由を説明する十分に文書化されたアラインメント失敗。シグナルを監視し、評価を実行し、エンドポイントを固定する。


