Дневник разработчика: как мы вскрыли роутер GPT-5

Дневник разработчика: как мы вскрыли роутер GPT-5

Серия экспериментов, много наблюдений и неожиданные выводы о том, как роутер OpenAI распределяет запросы между GPT-5 и GPT-5 Thinking.

Коротко о том, как мы в Bquadro тестировали новые модели Chat GPT - GPT-5 в первую неделю их выхода. Честно говоря, на момент публикации статьи 14 августа, OpenAI выкатили обновления по моделям, но это уже другая история=) А пока, расскажем, как это было.

Утро. С чего началось наше исследование ChatGPT-5

Как и любая компания, интегрирующая в свой бизнес нейросети и искусственный интеллект, мы не смогли пройти мимо новости о запуске gpt 5 - попробовать ее и поделиться впечатлениями захотели почти все. Наше исследование началось с простого наблюдения: в одних случаях GPT5 даёт ответы, которые приятно читать — они структурированные, глубокие, с чёткой логикой. В других — вроде та же модель, тот же вопрос, но ответ быстрее, короче и ощущается «поверхностным».

В команде это вызвало живой спор:

  • Одни пользователи говорили, что всё дело в случайности и температуре генерации.
  • Другие предполагали, что OpenAI «тихо» направляет разные запросы в разные версии модели.
  • Третьи были уверены, что это балансировка нагрузки на серверах.

Чтобы перестать гадать, мы решили провести систематический эксперимент.

Что мы хотели выяснить

Перед началом мы сформулировали три ключевых вопроса:

  1. Маршрутизация — как роутер OpenAI решает, отправить ли запрос в обычный Chat GPT-5 или в Chat GPT-5 Thinking?
  2. Качество Thinking — есть ли разница между автоматическим Thinking и Thinking, включённым вручную?
  3. Бесплатные аккаунты — что они реально получают, какие у этой версии gpt 5 ограничения, есть ли там урезанная версия Thinking?

Как мы проводили тесты модели GPT-5

Чтобы получить репрезентативные данные, мы подготовили несколько сценариев:

  • Сценарий 1: короткие вопросы на проверку знаний (факты, даты, определения).
  • Сценарий 2: большие задачи на анализ (10–15 страниц текста, которые нужно сжать в конспект).
  • Сценарий 3: многошаговые логические задачи (если X, то Y, но при условии Z).
  • Сценарий 4: творческие задания (сочетание креатива и фактов).

Мы запускали эти сценарии в четырёх режимах:

  1. GPT-5 платный тариф - обычная (без Thinking).
  2. GPT-5 - с автоматическим Thinking (когда роутер сам направляет туда).
  3. GPT-5 - с ручным Thinking.
  4. Доступный всем бесплатный тариф (авто Thinking или Thinking Mini).

Первые наблюдения

После пары десятков тестов картина стала понятнее:

  • На платных аккаунтах запросы действительно могут идти либо в GPT-5, либо в GPT-5-Thinking.
  • Внутри Thinking есть два режима — «автоматический» и «ручной».
  • Автоматический Thinking чаще даёт быстрые, но менее глубокие ответы.
  • Бесплатный тариф чаще использует Thinking Mini, который объективно слабее.

Автоматический vs ручной GPT-5 Thinking

Автоматический Thinking:

  • ответы быстрее (примерно на 15–25% по времени);
  • меньше деталей в сложных темах;
  • иногда упрощает рассуждения, пропуская промежуточные шаги.

Ручной Thinking:

  • ответы дольше (иногда в 1,5 раза);
  • глубина анализа заметно выше;
  • логика более прозрачная, шаги рассуждений прописаны лучше.

Вывод: разница особенно заметна на сложных задачах — например, в анализе длинных документов ручной Thinking выделяет больше релевантных фактов.

Бесплатный тариф и Thinking Mini

На бесплатном тарифе Chat GPT доступа к полноценному Thinking почти нет. В первые 1–2 запроса в неделю он может включиться, но чаще работает урезанная версия Thinking Mini:

  • меньше знаний (урезанная база фактов);
  • сложнее с большими текстами — путает структуру и пропускает важные элементы;
  • Логические цепочки короче, выводы упрощённые.

Таблица сравнения ответов моделей

Дневник разработчика: как мы вскрыли роутер GPT-5

Реальные сценарии, где выбор модели критичен

  • Юридический анализ документов — ручной Thinking удерживает больше нюансов.
  • Маркетинговые концепции — авто Thinking быстрее, но часто упускает глубину.
  • Программирование и архитектура — в ручном Thinking пояснения более развёрнутые.
  • Образовательный контент — Thinking Mini может перепутать факты, что критично.

Выводы

  • Если у вас подписка Plus и важна точность — включайте Thinking вручную.
  • Автоматический Thinking подходит для быстрых ответов, но не для сложных задач.
  • Chat GPT-5 бесплатный тариф — это в основном Thinking Mini, и качество там ниже.
Дневник разработчика: как мы вскрыли роутер GPT-5

Что дальше

Сейчас OpenAI, похоже, тестирует балансировку Thinking model и обычной модели GPT-5. Мы ждём, что появятся:

  • прозрачная индикация, в каком режиме вы находитесь;
  • возможность выбирать глубину Thinking прямо в интерфейсе;
  • более чёткие квоты по Thinking для бесплатных аккаунтов.

💡 Выводы по сравнению: сложная задача — ручной Thinking. Быстрый ответ — можно оставить автоматический. Бесплатный тариф — не стоит ждать максимальной глубины.

Мы в Телеграм: bquadro_agency

Приглашаем также изучить наш предыдущий материал в этом блоге — про использование режима Study Mode для корпоративного обучения и повышения квалификации сотрудников:

Начать дискуссию