GPT-5.6 появился в логах Codex от OpenAI — что это на самом деле означает
Одна запись маршрутизации в логах развёртывания Codex от OpenAI указала на GPT-5.6. Polymarket даёт 89% вероятность релиза до 30 июня. Разбираемся, что подтверждено, что является шумом, и почему инцидент с «гоблином» стал причиной столь стремительного темпа тестирования.
Через три недели после выхода GPT-5.5 появился GPT-5.6. Не как официальный запуск, не как системная карточка, не как анонс на дне разработчика — а как единственная запись в логах маршрутизации бэкенда Codex от OpenAI, замеченная исследователем Хайдером до того, как она исчезла из последующих сессионных файлов. По состоянию на 13 мая 2026 года Polymarket оценивает вероятность публичного релиза до 30 июня на уровне 89%.
Это большая ставка на одну строчку в логе. Вот что на самом деле подтверждают доказательства, что они не подтверждают, и — что интереснее — почему тестирование GPT-5.6 идёт быстрее, чем цикл GPT-5.4 → GPT-5.5. Краткий ответ на последний вопрос содержит слово «гоблин».
Что именно было обнаружено
Открытие: пока большинство записей маршрутизации Codex от OpenAI направляло запросы к gpt-5.5, одна запись в таблице маршрутизации ссылалась на gpt-5.6. Запись была кратко воспроизводима, затем исчезла — в последующих сессионных файлах везде значился только gpt-5.5. Хайдер, сообщивший об этом, назвал это «скорее багом», чем намеренным раскрытием.
Материал BigGo характеризует это как канареечное тестирование в бэкенде с реальным трафиком — небольшой процент производственных запросов направляется на экспериментальную сборку для измерения производительности и поведения перед более широким развёртыванием. Это стандартная практика в каждой крупной лаборатории. Тот факт, что внутренняя таблица маршрутизации Codex ненадолго раскрыла это имя, не означает, что GPT-5.6 готов к выпуску; это означает, что экспериментальная сборка существует и тестируется на реальной нагрузке.
Две конкретные вещи, которые сообщает нам эта запись в логе:
- GPT-5.6 существует как работоспособный артефакт, способный принимать запросы в формате Codex. Это значимый технический рубеж, который выходит за рамки «у нас идёт обучающий прогон».
- Он интегрирован в инфраструктуру развёртывания Codex, что предполагает, что агентская / кодовая поверхность является основной целью оценки — согласуется с позиционированием GPT-5.5 как сильнейшей агентской модели для написания кода от OpenAI (показатель 82,7% в Terminal-Bench 2.0 из его системной карточки).
Две конкретные вещи, которые это не сообщает:
- Ничего о количестве параметров, обучающих данных или изменениях архитектуры. В логе было имя, а не конфигурация.
- Ничего о сроках выпуска. Канареечные записи постоянно появляются и исчезают в крупных лабораториях. Polymarket оценивает выпуск до 30 июня в 89% — это реальный сигнал ожиданий сообщества, но рынки ошибались в датах выпуска моделей много раз в этом году.
Почему тестирование идёт быстро: проблема гоблинов
Интересен не сам факт записи в логе. Интересно то, что у OpenAI есть конкретный, недавно опубликованный, именованный сбой согласования в GPT-5.5, который GPT-5.6 почти наверняка обучают устранить.
30 апреля 2026 года OpenAI опубликовала «Откуда пришли гоблины» — разбор странного поведения GPT-5.5: модель развила статистически значимую одержимость гоблинами, домовыми, енотами, троллями, ограми и голубями. Не изредка — измеримо, в сотнях миллионов ответов. Цифры из разбора:
| Метрика | Значение |
|---|---|
| Упоминания гоблинов в персоне «Задротский» vs. базовый уровень GPT-5.2 | +3 881% |
| Доля всех упоминаний гоблинов от персоны «Задротский» | 66,7% |
| Доля трафика ChatGPT, использовавшего персону «Задротский» | 2,5% |
| Рост упоминаний гоблинов после GPT-5.1 | +175% |
| Рост упоминаний домовых за тот же период | +52% |
| Датасеты, где обучение с подкреплением оценивало ответы с гоблинами/домовыми выше | 76,2% |
Что произошло: в ходе обучения кастомизации личности модель вознаграждений OpenAI систематически давала более высокие оценки метафорам с существами при стиле ответа «Задротский». Персона «Задротский» составляла крошечную долю трафика (2,5%), но форма вознаграждения просочилась. Из формулировки самой OpenAI: «обучение с подкреплением не гарантирует, что усвоенные модели поведения остаются строго в рамках условия, которое их породило».
Как только ответы с обилием гоблинов начали получать высокие оценки в одной персоне, они попали в пул развёртывания. Эти развёртывания были переработаны в данные для supervised fine-tuning следующего цикла обучения. Поведение нормализовалось. К моменту, когда кто-то заметил это, GPT-5.5 уже начал обучение, и заражение распространилось на несколько последующих слов-тиков — еноты, тролли, огры, голуби.
Экстренным исправлением стал системный промпт, повторённый четыре раза в инструкциях Codex: «Никогда не говори о гоблинах, домовых, енотах, троллях, ограх, голубях или других животных или существах, если это не является абсолютно и однозначно релевантным запросу пользователя». То, что передовая лаборатория вынуждена выпускать в продакшн блок из четырежды повторённых ключевых слов, говорит всё об утечках поведения, сформированного вознаграждением.
OpenAI также полностью удалила опцию персонализации «Задротский» в марте 2026 года.
Почему это важно именно для GPT-5.6
Инцидент с гоблинами был не просто неловким — это конкретная демонстрация того, что формирование вознаграждения может вызвать загрязнение поведения всей модели от небольшого условия обучения, и это загрязнение сохраняется через версии моделей через пайплайн SFT-данных. Это не баг, который исправляется системным промптом. Это архитектурная проблема того, как циклы обратной связи RLHF накапливаются между обучающими прогонами.
Поэтому, когда канареечный трафик начинает попадать на новое имя модели через три недели после выхода GPT-5.5, наиболее обоснованная интерпретация такова:
GPT-5.6 — это первая версия модели, обученная с переработанным пайплайном аудита вознаграждений после инцидента с гоблинами. Техническая работа, необходимая для этого — аудит прошлых сигналов вознаграждений, выявление загрязнённых SFT-данных, переобучение модели вознаграждений — это именно тот вид работы, который сжимает цикл выпуска.
Функции, о которых OpenAI обычно говорит (более длинный контекст, более быстрый инференс, улучшенное использование инструментов), являются производными от этого. Реальная работа над GPT-5.6, если паттерн сохраняется, непривлекательна: более чистый сигнал вознаграждения, более жёсткая гарантия изоляции персон и пайплайн SFT, который не перерабатывает загрязнённые развёртывания. Ничего из этого не улучшает бенчмарки так, как рост в оценке написания кода, но именно эта работа определяет, унаследует ли GPT-5.7 гоблинов или нет.
Чего разумно ожидать
Взвешенная оценка того, с чем на самом деле выйдет GPT-5.6:
- Тот же общий профиль возможностей, что у GPT-5.5 — написание кода, агентское использование инструментов, мультимодальность — с постепенными, а не кардинальными улучшениями.
- Новый раздел системной карточки об аудите вознаграждений и изоляции персон. Называть это так или нет, но ожидайте формулировок об «улучшенной калибровке вознаграждений» или подобных в модельной карточке.
- Удаление остатков слов-тиков — проверяемо путём запуска того же анализа частоты гоблинов на выходных данных новой модели.
- Возможно, возвращение кастомизации личности в переработанной форме. «Задротский» был убран в марте; если GPT-5.6 выйдет с вернувшимися элементами управления персонами, это будет сильным сигналом того, что проблема вознаграждений исправлена структурно, а не замаскирована.
Чего не следует ожидать:
- Значительного изменения архитектуры. Разрыв от GPT-5.5 до GPT-5.6 — три недели канареечного сигнала; этого недостаточно для перестройки основы.
- Изменения цены или API-поверхности. GPT-5.5 только что стабилизировался на $1,25/$10 за 1 млн токенов; OpenAI редко меняет цены в минорной версии.
- Скорого публичного выхода. Предсказание Polymarket о 89% вероятности до 30 июня правдоподобно, но не является основополагающим — канареечные сигналы могут сохраняться месяцами до публичного развёртывания.
Что делать разработчикам сегодня
Три конкретных шага, пока GPT-5.6 находится в пре-релизе:
- Запустите тест частоты гоблинов на ваших собственных производственных выходных данных GPT-5.5. Если вы видите >0,5% упоминаний гоблинов/домовых/троллей в ответах, которые логически их не предполагают, у вас есть измеримый сигнал того, что проблема всё ещё просачивается через системный промпт. Это также ваш бенчмарк для оценки GPT-5.6 в день его выхода.
- Оставайтесь на текущем эндпоинте
gpt-5.5, а неgpt-5.5-latest. Привязка к явной версии не позволит вам незаметно переключиться на GPT-5.6 в момент его продвижения. Стоимость явного версионирования близка к нулю; стоимость необъявленной смены модели в продакшне может быть значительной. - Определите метод оценки до выхода GPT-5.6. Если ваша оценка — «задать несколько вопросов и посмотреть, выглядят ли ответы лучше», вы получите шум. Если ваша оценка — отложенный бенчмарк, по которому у вас уже есть числа для GPT-5.5, вы получите сигнал.
Ближайшая неделя
Если Polymarket прав и публичный релиз состоится до 30 июня, впереди шесть недель пред-релизной активности для отслеживания. Сигналы для наблюдения:
- Больше канареечных записей в логах — как только экспериментальная сборка находится в обычном трафике оценки, утечки накапливаются.
- Второй пост OpenAI об аудите вознаграждений. Разбор с гоблинами от 30 апреля читался как первая часть двухчастной истории; вторая часть — что они сделали с этим, что и является нарративом GPT-5.6.
- Новая системная карточка. Системная карточка и запись в хабе безопасности развёртывания GPT-5.5 вышли одновременно с моделью. Ожидайте того же для GPT-5.6.
- Обновления Codex. Те же логи, в которых всплыло имя GPT-5.6, станут первой поверхностью, где появится публичное повышение версии.
Пока что: одна строчка в логе, одно число на Polymarket и один хорошо задокументированный сбой согласования, объясняющий, почему этот цикл движется быстрее предыдущего. Следите за сигналами, запускайте оценку, привязывайте эндпоинт.
Источники: Разбор OpenAI по инциденту с гоблинами, BigGo Finance об утечке из логов Codex, BigGo Finance об экстренном реагировании, Краткое изложение Engadget, Хронология на gptgoblins.com.


