Дневник разработчика: как мы вскрыли роутер GPT-5
Серия экспериментов, много наблюдений и неожиданные выводы о том, как роутер OpenAI распределяет запросы между GPT-5 и GPT-5 Thinking.
Коротко о том, как мы в Bquadro тестировали новые модели Chat GPT - GPT-5 в первую неделю их выхода. Честно говоря, на момент публикации статьи 14 августа, OpenAI выкатили обновления по моделям, но это уже другая история=) А пока, расскажем, как это было.
Утро. С чего началось наше исследование ChatGPT-5
Как и любая компания, интегрирующая в свой бизнес нейросети и искусственный интеллект, мы не смогли пройти мимо новости о запуске gpt 5 - попробовать ее и поделиться впечатлениями захотели почти все. Наше исследование началось с простого наблюдения: в одних случаях GPT5 даёт ответы, которые приятно читать — они структурированные, глубокие, с чёткой логикой. В других — вроде та же модель, тот же вопрос, но ответ быстрее, короче и ощущается «поверхностным».
В команде это вызвало живой спор:
- Одни пользователи говорили, что всё дело в случайности и температуре генерации.
- Другие предполагали, что OpenAI «тихо» направляет разные запросы в разные версии модели.
- Третьи были уверены, что это балансировка нагрузки на серверах.
Чтобы перестать гадать, мы решили провести систематический эксперимент.
Что мы хотели выяснить
Перед началом мы сформулировали три ключевых вопроса:
- Маршрутизация — как роутер OpenAI решает, отправить ли запрос в обычный Chat GPT-5 или в Chat GPT-5 Thinking?
- Качество Thinking — есть ли разница между автоматическим Thinking и Thinking, включённым вручную?
- Бесплатные аккаунты — что они реально получают, какие у этой версии gpt 5 ограничения, есть ли там урезанная версия Thinking?
Как мы проводили тесты модели GPT-5
Чтобы получить репрезентативные данные, мы подготовили несколько сценариев:
- Сценарий 1: короткие вопросы на проверку знаний (факты, даты, определения).
- Сценарий 2: большие задачи на анализ (10–15 страниц текста, которые нужно сжать в конспект).
- Сценарий 3: многошаговые логические задачи (если X, то Y, но при условии Z).
- Сценарий 4: творческие задания (сочетание креатива и фактов).
Мы запускали эти сценарии в четырёх режимах:
- GPT-5 платный тариф - обычная (без Thinking).
- GPT-5 - с автоматическим Thinking (когда роутер сам направляет туда).
- GPT-5 - с ручным Thinking.
- Доступный всем бесплатный тариф (авто Thinking или Thinking Mini).
Первые наблюдения
После пары десятков тестов картина стала понятнее:
- На платных аккаунтах запросы действительно могут идти либо в GPT-5, либо в GPT-5-Thinking.
- Внутри Thinking есть два режима — «автоматический» и «ручной».
- Автоматический Thinking чаще даёт быстрые, но менее глубокие ответы.
- Бесплатный тариф чаще использует Thinking Mini, который объективно слабее.
Автоматический vs ручной GPT-5 Thinking
Автоматический Thinking:
- ответы быстрее (примерно на 15–25% по времени);
- меньше деталей в сложных темах;
- иногда упрощает рассуждения, пропуская промежуточные шаги.
Ручной Thinking:
- ответы дольше (иногда в 1,5 раза);
- глубина анализа заметно выше;
- логика более прозрачная, шаги рассуждений прописаны лучше.
Вывод: разница особенно заметна на сложных задачах — например, в анализе длинных документов ручной Thinking выделяет больше релевантных фактов.
Бесплатный тариф и Thinking Mini
На бесплатном тарифе Chat GPT доступа к полноценному Thinking почти нет. В первые 1–2 запроса в неделю он может включиться, но чаще работает урезанная версия Thinking Mini:
- меньше знаний (урезанная база фактов);
- сложнее с большими текстами — путает структуру и пропускает важные элементы;
- Логические цепочки короче, выводы упрощённые.
Таблица сравнения ответов моделей
Реальные сценарии, где выбор модели критичен
- Юридический анализ документов — ручной Thinking удерживает больше нюансов.
- Маркетинговые концепции — авто Thinking быстрее, но часто упускает глубину.
- Программирование и архитектура — в ручном Thinking пояснения более развёрнутые.
- Образовательный контент — Thinking Mini может перепутать факты, что критично.
Выводы
- Если у вас подписка Plus и важна точность — включайте Thinking вручную.
- Автоматический Thinking подходит для быстрых ответов, но не для сложных задач.
- Chat GPT-5 бесплатный тариф — это в основном Thinking Mini, и качество там ниже.
Что дальше
Сейчас OpenAI, похоже, тестирует балансировку Thinking model и обычной модели GPT-5. Мы ждём, что появятся:
- прозрачная индикация, в каком режиме вы находитесь;
- возможность выбирать глубину Thinking прямо в интерфейсе;
- более чёткие квоты по Thinking для бесплатных аккаунтов.
💡 Выводы по сравнению: сложная задача — ручной Thinking. Быстрый ответ — можно оставить автоматический. Бесплатный тариф — не стоит ждать максимальной глубины.
Мы в Телеграм: bquadro_agency
Приглашаем также изучить наш предыдущий материал в этом блоге — про использование режима Study Mode для корпоративного обучения и повышения квалификации сотрудников: