Версии модели GPT-5: от GPT-5 до GPT-5.4

Привет, я Дора. Я не планировала писать о моделях GPT-5 на этой неделе. Просто снова застряла, выбирая версию в выпадающем списке моделей. Небольшая пауза, потом знакомый вопрос: действительно ли 5.2 поможет здесь, или я нажимаю на более новую версию просто потому, что она новее?

Доступно на WaveSpeedAI — прозрачная цена за токен, OpenAI-совместимый endpoint. GPT-5.5 API → · GPT-5.4 API → · Открыть Playground →

Это небольшое трение затянуло меня в кроличью нору. Я провела несколько вечеров в конце февраля и начале марта 2026 года, прогоняя одни и те же задачи через всё семейство 5.x: краткое исследовательское резюме, структурированное извлечение JSON и простой рефакторинг кода с несколькими файлами. Ничего эффектного. Просто такая работа, которая либо ощущается проще, либо нет. Это мои полевые заметки, а не торжественный отчёт.

Почему GPT-5 — это система, а не одна модель

Я постоянно вижу, как люди говорят о «той самой» модели GPT-5, будто это единственный мозг, который можно просто подключить. Это не совпадает ни с тем, что я наблюдала, ни с тем, на что OpenAI намекает в своей документации и публичных выступлениях.

Обзор архитектуры маршрутизатора

Поведение выглядит как маршрутизируемая система: одна «входная точка», которая тихо решает, какой внутренний специалист будет обрабатывать ту или иную часть вашего запроса. Можно представить это как диспетчера движения с несколькими целями: держать задержку стабильной, достигать порога качества и не запускать дорогостоящих специалистов, если запрос этого действительно не требует. Именно поэтому один и тот же промт может ощущаться немного по-разному в режимах «быстрый» и «стандартный», или в смежных версиях — в игре участвует больше одной модели.

На практике я замечала признаки этого в следующих случаях:

Вызов инструментов срабатывает быстрее при определённых запусках, как будто планировщик подключился раньше.
Надёжность режима JSON резко возрастает после обновления на стороне системы, даже если параметры API не менялись.
Задержка держится под нагрузкой лучше, чем должна была бы у единого монолита.

Я не могу заглянуть за кулисы, но результаты указывают на маршрутизатор, который взвешивает стоимость, скорость и тип задачи, а затем выбирает путь. Такое понимание помогает мне объяснить, почему два ярлыка «GPT-5» могут вести себя по-разному.

Как работает версионирование OpenAI

OpenAI обычно выпускает семейства моделей с именованными версиями и периодическими сборками «preview». Со временем версия может стать стандартной, а затем устареть. Ярлыки могут меняться быстрее, чем успевают обновляться публикации в блогах. Когда я сомневаюсь, я проверяю документацию по моделям OpenAI и журнал изменений API, прежде чем зафиксировать версию. Также стоит просмотреть справочник по API на предмет небольших, но важных флагов (схема ответа, режимы JSON, нюансы вызова инструментов), которые меняются между версиями.

Поэтому когда я говорю «GPT-5», я имею в виду маршрутизируемую систему, доступную под этим именем семейства. А когда я говорю «5.1» или «5.3», я имею в виду конкретную конфигурацию этой системы — часто с другими настройками по умолчанию, немного другими маршрутизаторами и иногда новыми средствами защиты или повышения надёжности.

GPT-5 (Базовая) — Начальные возможности

Сначала я рассматривала базовый GPT-5 как универсала. Не потому что это было волшебство, а потому что он справлялся с тремя распространёнными задачами достаточно хорошо при минимальной настройке.

Основные возможности на момент запуска

Ясность рассуждений: При задачах планирования — «набросай 3-шаговый подход, затем заполни шаг 1» — базовая модель придерживалась структуры, не требуя излишних объяснений с моей стороны. Без показухи. Надёжно.
Работа с инструментами без лишних сложностей: Вызов функций работал из коробки. Когда я просила извлечь структурированные поля, модель в большинстве случаев передавала согласованные, типизированные аргументы.
Длинный контекст без сбоев: Я загружала объёмные брифы и многочастные ссылки. Модель оставалась достаточно связной, чтобы быть полезной, особенно когда я структурировала текст заголовками разделов.
Режим JSON и схемы ответов: С простой схемой я могла получать разбираемые результаты 8–9 раз из 10 с первой попытки. Когда это не удавалось, отказ был очевидным (усечённый объект) — странное, но полезное свойство.

Ранние ограничения

Детерминизм остаётся нестрогим: даже при низкой температуре повторные запуски слегка меняли формулировки и иногда порядок элементов. Для production мне пришлось добавить лёгкую постобработку (сортировка ключей, нормализация пробелов), чтобы дифы оставались чистыми.
Память вызовов инструментов: при цепочке инструментов модель иногда «забывала» граничные ограничения предыдущего инструмента, если я их не повторяла. Небольшая, но реальная проблема.
Скачки задержки: большинство вызовов проходили нормально. Но один-два занимали заметно больше времени. Не минуты, но достаточно, чтобы сломать плотный цикл.
Осознанность стоимости: базовая версия была недешёвой, поэтому небрежно длинные промты ощущались дорогостоящими. Я стала сокращать системные сообщения и переносить шаблонный код в отдельные заготовки. Простой шаг, значимая экономия.

GPT-5.1 — GPT-5.3 — Инкрементальные изменения

Эти точечные релизы не изменили характер моделей GPT-5. Они подтянули гайки.

Улучшения по версиям

5.1: Следование инструкциям стало чётче. Когда я просила «только пункты, без вступления», модель слушалась чаще. Соответствие JSON тоже немного улучшилось.
5.2: Лучшее основание на цитатах. Когда я предоставляла отрывки и просила делать резюме с опорой на цитаты, модель точнее привязывалась к цитируемому тексту. Галлюцинации снизились — не до нуля, но достаточно заметно.
5.3: Вызов инструментов стал более надёжным под нагрузкой. Меньше странных форм аргументов. В моих логах также появился чуть более быстрый первый токен, хотя это может быть следствием умной маршрутизации, а не самой модели.

Всё это проявлялось незаметными способами: меньше повторных попыток, меньше уборки, меньше подсказок в промтах.

Различия, важные для разработчиков

Схемы ответов: новые релизы стали придирчивее в хорошем смысле. Когда я объявляла схему, они либо следовали ей, либо быстро давали сбой. Это сэкономило мне больше времени, чем любой прирост «интеллекта».
Потоковые дельты: поток токенов приходил более стабильными порциями. Проще строить интерфейсы без мерцания.
Толерантность к сигнатурам инструментов: 5.2 и 5.3 обрабатывали строгие типы без импровизации. Если поле было перечислением, модель реже придумывала новые значения. Это сократило объём защитного кода.

Мелочи, но они устраняют занозы. Если вы сопровождаете агентов, мелочи имеют большое значение при многочисленных вызовах.

Что осталось неизменным

Реальность длины контекста: загрузка огромного контекста по-прежнему наказывает задержкой и стоимостью. Обрезка и индексация по-прежнему выигрывают.
Дрейф стиля: даже с примерами тон немного блуждает на длинных выводах. Я храню эталонные фрагменты и прошу модель им подражать — работает лучше, чем прилагательные.
«Гениальность с первого раза» — редкость: лучшие результаты по-прежнему достигаются за счёт устойчивых строительных лесов, чётких целей, небольших шагов и обратной связи. Модель стала лучше, но дизайн моей системы имел большее значение.

GPT-5.4 — Что сейчас говорят утечки

У меня нет доступа к 5.4 на момент написания этого текста. Я опираюсь на публичные крупицы информации, разговоры разработчиков, несколько упоминаний в SDK, которые люди заметили, и общую закономерность развития этих семейств. Воспринимайте это как направление, а не как окончательный вывод. Если вы близки к окну запуска, проверьте документацию по моделям и свежие примечания к релизу.

Упоминания быстрого режима

Активно обсуждается «быстрый» или «turbo» путь маршрутизации в 5.4. Моё предположение: профиль с приоритетом низкой задержки, который ослабляет несколько защитных ограничений по качеству — по духу похоже на скоростные уровни, которые мы видели в прошлых семействах. Если это реализуется, я бы ожидала:

Более быстрый первый токен.
Чуть большую вариативность точного форматирования, если не использовать строгие схемы.
Лучшее поведение при параллельной работе для чат-интерфейсов и живых агентов.

Если для вас ощущаемая скорость важнее идеальных формулировок, это может стать стандартным выбором.

Сигналы об обработке изображений

Несколько намёков указывают на более сильное понимание изображений и более надёжное OCR для сложных входных данных (блики, перекошенные чеки, скриншоты кода). Я также ожидаю более стабильных ответов на графики и таблицы, особенно если вы предоставляете целевую схему. Практический вывод: меньше ручной предобработки. Сегодня я часто обрезаю или улучшаю изображения перед отправкой. Если 5.4 сможет поглощать больше этого хаоса, один целый шаг исчезнет.

Улучшения рабочего процесса программирования

Обсуждение здесь сосредоточено на планировании и правках в нескольких файлах. Если это правда, 5.4 может:

Предлагать более чёткие планы шагов перед изменением кода.
Сохранять согласованные сигнатуры функций в разных файлах.
Сокращать ошибки на единицу и проблемы с путями импорта.

Даже небольшой прирост надёжности важен. В моих тестах с более ранними версиями 70–80% «потерянного времени» было не из-за логики, а из-за исправления самоуверенных, но слегка ошибочных правок. Если 5.4 сократит это даже на 10–15%, это будет ощущаться как больше, чем инкрементальный релиз.

Как разработчики выбирают между версиями GPT-5.x

Я не выбираю версию потому, что так сказал какой-то блог. Я провожу маленькие, скучные тесты. Вот подход, который работает для меня.

Соответствие версий задачам

Создание контента с контролем тона: я склоняюсь к более новым (5.2/5.3), потому что соблюдение стиля немного улучшилось. Я храню небольшую библиотеку примеров тона и ссылаюсь на неё.
Структурированное извлечение: побеждает та версия, которая даёт наибольшее соответствие схеме. В последнее время это 5.2 или 5.3 с явными схемами ответов. Я всё равно добавляю валидатор и повторную попытку.
Агенты и инструментальные рабочие процессы: 5.3 была наиболее стабильной в части аргументов функций. Если быстрый режим 5.4 реален, я буду A/B-тестировать его для живых агентов, которым нужен быстрый диалог важнее идеальной прозы.
Помощь с кодом: я начинаю с коротким контекстом и сначала прошу составить план. Если модель не может написать убедительный план, она не напишет чистые дифы. Смежные версии 5.x достаточно различаются здесь, чтобы это имело значение — тестируйте на своём репозитории, а не на учебном файле.

Я отслеживаю три числа для каждого сценария использования: доля успешных проходов с первой попытки, средняя задержка и процент вызовов, требующих ручной доработки. Если более новая версия не улучшает хотя бы один из этих показателей, я не переключаюсь.

Компромисс между стоимостью и возможностями

Ценообразование OpenAI меняется, и я не буду угадывать числа здесь. Однако закономерность стабильна:

Более новые модели не всегда дороже, но могут быть. Я бюджетирую по токенам, а не по интуиции.
Длинные промты умножают стоимость. Я убираю шаблоны, сжимаю примеры и использую внешние идентификаторы там, где это возможно.
Если вы обрабатываете пакеты (резюме, извлечения), обычно выигрывает самая дешёвая надёжная версия. Если вы работаете с пользователями напрямую, ощущаемая скорость часто важнее чистой стоимости.

Два практических совета, которые сэкономили мне деньги и время:

Золотые наборы: храните 20–50 реальных промтов с известными хорошими результатами. Перезапускайте их, когда рассматриваете переключение. Никакой памяти, только чистые сравнения. Компромиссы станут очевидны быстро.
Ограничения в коде, а не в тексте: схемы, валидаторы и небольшие постпроцессоры лучше, чем абзацы инструкций.

Политика обновления страницы (поддерживается постоянно)

Я обновляю эту страницу, когда вижу значимые изменения в моделях GPT-5, — обычно после повторного прогона моего тестового набора или когда меняется документация OpenAI. Я добавляю краткую заметку с датой, что я тестировала и что изменилось (если что-то изменилось). Я ссылаюсь на официальные источники там, где могу, и отмечаю неопределённость, когда не могу что-то проверить.

Если вы сталкиваетесь с похожими ограничениями, стоит заглядывать сюда время от времени — но не ждите меня. Документация по моделям является источником истины. Я веду свои заметки стабильно, но не исчерпывающе.

Маленькое наблюдение напоследок: чем больше я воспринимаю «GPT-5» как живую систему, а не как единственный переключатель, тем спокойнее становятся мои решения. Выпадающий список перестаёт ощущаться как экзамен. Это просто ручка, которую я кручу осознанно.