Сравнение GPT-5 и Codex: что выбрать для программирования

Вижу вокруг много обсуждений какие из моделей лучше — gtp-5 или все-таки codex (оставим за скобками все остальные).

Напоминаю просто, что GPT-5 это модель общего уровня. Она не натаскана именно на кодинг и вдвойне не натаскана на своеобразный стиль консольных агентов — быстро делать большое количество мелких команд, скриптов и точечных диффов.

И наоборот — кодекс по ощущениям — это очень специфический дистиллят, который плохо умеет в общие инструкции. Ему нужен совершенно своеобразный тулинг для успешной работы, и без него он недееспособен. Вместе с этим, с хорошим тулингом показывает феноменальные результаты в некоторых задачах.

И отсюда специфика использования.

GPT-5

  • хорошо читает код крупными кусками.
  • не путается в однородных по семантике, но разных сущностях (три способа авторизации в проекте)
  • хорош в качестве архитектора
  • не требует расписать все заранее
  • может проявлять себя в разных ролях
  • показывает максимум на больших промптах. Регулярно кидаю в него от 100к до 200к токенов — и он предоставляет максимум результата.

Минусы: ошибается в диффах, ошибается в тулколинге (редко, но бывает), не оптимально пишет, медленный.

Codex

  • читает код сниппетами, грепами и прочими мелкими сущностями
  • плохо владеет бизнес-онтологией, тупит в написании архитектуры
  • оперирует практически исключительно консолью, не умеет в другие инструменты
  • очень круто делает диффы и точечные изменения, приктически ниикогда в них не ошибается
  • хорошо ориентируется в однородных сущносях, рассыпаных по коду
  • показывает максимум на небольших промптах, но с четко заданной архитектурой.

Отсюда специфика применения.

  • Архитектуры (спеки по SDD) делаем где угодно за пределами кодекса. GPT-5 идеальная модель для этого на данный момент.
  • по готовой архитектуре работаем как с кодексом, так и с gpt (с кодексом точнее)
  • если нужен обширный рефакторинг с простой не-пересекающийся семантикой, то кодекс — SOTA модель на рынке. Если нужно использовать тулинг за пределами кода (что-то инсталлить, добиться зеленых тестов, линтеров и т.д.) — тоже.
  • если семантика ветвистая, то gpt-5 в этом ориентируется лучше

Лично у меня кодекс (софт) с кодексом (модель) стоит одним из окон внутри курсора, кормлю его достаточно сложными задачами, если не вижу в них подвоха и двойного дна.

Подписывайтесь на Telegram Глеб про AI.

Начать дискуссию