Codex vs Claude Code: 4 задачи где Codex выигрывает

Codex vs Claude Code: 4 задачи где Codex выигрывает

Я полгода жил в Claude Code. Max-подписка $200, Opus 4.7, ритуал утреннего claude . в проекте. Сел на Codex как на эксперимент. За 3 недели нашёл 4 задачи, где Codex обгоняет Claude Code, и составил workflow распределения. Сейчас плачу $220 в месяц за обе подписки и сжигаю меньше денег, чем раньше на одной.

Тут нет победы «Codex над Claude Code». Есть 4 типа задач, где async-агент Codex физически делает работу, которую Claude Code не вытянет. И есть 5-й тип, где я тут же возвращаюсь в Claude Code, потому что Codex там слабее. Парадокс: больше подписок - меньше сожжённых денег.

Если коротко: Codex не для написания. Codex для делегирования.

Workflow распределения задач (готовый шаблон забирай)

На третий день эксперимента положил в корень репозитория файл tasks-router.md - карту решений «какая задача в какой инструмент». Без неё я тратил по 2-3 минуты на «а где сейчас удобнее это сделать». С ней - открываю задачу, смотрю на 5 признаков, запускаю нужный инструмент.

Логика router'а простая. 5 признаков задачи:

  • Размер контекста. Задача требует прочитать >100K токенов кода - Codex. Sandbox держит большие массивы без обвала контекстного окна. Claude Code в такой массе тонет.
  • Нужен ли диалог. Будешь уточнять и переделывать - Claude Code. Codex прорывается до конца.
  • Можно ли делегировать. Описал и забыл на 20-40 минут - Codex async. Надо следить - Claude Code.
  • Параллельность. Задач несколько и независимы - Codex запускает 3-5 инстансов параллельно.
  • Глубина мышления. Архитектура, выбор паттерна, продуктовое обсуждение - Claude Code. «Сделай по шаблону» - Codex.

Вот сам файл из моего репозитория. Скопируй, замени placeholder'ы, положи в корень.

# tasks-router.md # Карта решений: какой агент для какой задачи # Положить в корень репо [твой проект]. Обновляется по ходу. ## Codex async (фоновый sandbox) Признаки: - Размер контекста > 100K токенов - Нет диалога: описал - получил результат - Делегирование на 20-40 минут - Параллельная очередь (3-5 задач сразу) - Глубина минимальная (рутина, шаблон) Случаи: - [ ] Рефакторинг модуля > 5000 строк - [ ] Cleanup dead code по проекту - [ ] CRUD-эндпоинты по существующему паттерну - [ ] Базовые UI-компоненты по дизайн-системе - [ ] Миграции данных, скрипты переноса - [ ] Генерация тестов по существующим функциям Команда: codex --reasoning high "<задача>" --sandbox ## Claude Code (синхронный диалог) Признаки: - Архитектура, выбор паттерна - Длинный диалог «давай переделаем» - Чувствительная безопасность - UI/UX с обратной связью итерациями - Продуктовое обсуждение фичи Случаи: - [ ] Проектирование нового модуля с нуля - [ ] Security review критичных кусков - [ ] Frontend-работа с iteration по дизайну - [ ] Сложные баги где нужен ход мысли - [ ] Plan Mode перед запуском фичи Команда: claude . (внутри проекта) Effort: medium, xhigh только для архитектуры ## Cline + DeepSeek (резерв если VPN упал) - [ ] Любая задача из Codex-списка без VPN ## Решение за 10 секунд 1. Контекст > 100K? → Codex 2. Можно делегировать на 30 минут? → Codex async 3. Нужен диалог? → Claude Code 4. Архитектура / продукт? → Claude Code 5. Иначе → Codex (default для рутины) ## Логи за неделю [твой ник] | Дата | Задача | Инструмент | Время | Итог | |------|--------|------------|-------|------| | | | | | |

Я веду эту таблицу в конце файла руками - дисциплина 30 секунд на задачу. Через месяц у тебя реальная картина, какой инструмент тащит твои сценарии. Не обзоры на Reddit - твои сценарии.

Под свой проект router адаптируется за 15 минут. Перебери последние 30 задач из git log, прогони каждую по 5 признакам и помечай галочкой в подходящий блок. Если в проекте нет рефакторингов на 5000 строк - смело удаляй первый случай из списка Codex async. Если работаешь в монорепо со связкой бэкенд+фронтенд, добавь свой блок про межсервисные миграции. Через 2-3 недели router станет личной памяткой, а не общим шаблоном из статьи - и именно тогда начнёт реально экономить тебе минуты на каждой задаче.

Задача №1: большие рефакторинги где Claude Code упирается в контекст

Пример из мая. Модуль оплат СмыслоКода - 8200 строк в одном файле: YooKassa, Yandex Pay, рассрочка, реферальные купоны, чеки 54-ФЗ. Я хотел разобрать его на 6 файлов по доменам.

Открыл Claude Code Max, дал задачу. Opus 4.7 выдал план разбивки. Говорю «начинай». Через 4 минуты вижу: Context limit approaching, 187K of 200K used. Прочитал файл, 12 связанных импортов, тесты - упёрся в потолок до того, как написал хоть одну строку нового кода.

Три захода с приёмами: сжать через rewind, разбить на 6 сессий, выкинуть тесты. Каждый раз - потеря логики между файлами или потолок на 60-70% задачи. За день не продвинулся ни на строку.

Я разбирал в отдельном материале, куда уходят токены в Claude Code - 9 паттернов, из-за которых 200K окно сгорает за 4 минуты. Знание этих паттернов помогает выбирать, что вообще не имеет смысла отдавать в синхронного агента.

На четвёртый день поставил Codex, дал тот же модуль через codex --reasoning high. Sandbox прочитал файл, развёл на 6 этапов, пошёл работать. Я закрыл ноутбук, ушёл ужинать. Вернулся через 18 минут - 6 файлов созданы, импорты подтянуты, тесты переписаны, TODO на 4 места с неясной бизнес-логикой.

(скриншот: Codex async-таск через 18 минут, draft готов)

Цифры:

  • Claude Code Max ($200/мес): 3 захода за день, 0 строк готового кода, ~12% месячного лимита Opus 4.7 впустую.
  • Codex Plus ($20/мес) с reasoning=high: 1 запуск, 18 минут фоном, ~3500 строк draft'а на 90% готовности. Доделал 4 TODO руками за час.

Opus 4.7 работает синхронно: держит все 8200 строк в голове. Codex async читает кусками, пишет кусками, держит только текущий subagent. Для рефакторинга >5000 строк это разница между «не вытянул» и «сделал за ужин».

Правило в tasks-router.md: модуль >5000 строк или >20 файлов - сразу Codex async.

Второй кейс случился через неделю - миграция API с REST на tRPC. 34 endpoint'а в src/app/api/, каждый со своими типами, валидацией через Zod, проверкой авторизации. До Codex прикидывал на 2-3 рабочих дня в Claude Code с разбивкой по 5-6 endpoint'ов за сессию. Запустил Codex с reasoning=high одной командой «перенеси все endpoint'ы в tRPC-роутеры, типы вытяни в src/server/routers/, оставь обратную совместимость через прокси на старые URL». Вернулся через 52 минуты - 31 endpoint мигрирован, 3 в TODO с пометкой «сложная логика мультиплексирования, нужно ручное решение». Доделал 3 куска за 40 минут. По часам - 1.5 часа моего внимания вместо 3 дней.

Задача №2: параллельная работа над 3-5 микро-задачами

Async-режим Codex запускает несколько инстансов одновременно. Это второй сценарий смены правил.

Прошлая пятница. 3 независимые задачи: миграция БД (поле cohort_capacity_real), настройка GitHub Actions (npm run build как обязательный check), переписать README. Каждая - 30-60 минут. В Claude Code делал бы последовательно: 2-3 часа внимания.

В Codex открыл 3 терминала: миграция, Actions, README. Каждый в свой sandbox. Ушёл записывать эфир на 45 минут. Вернулся - все три готовы. Просмотрел diff'ы, в миграции поправил тип поля (Codex взял INT, я хотел INTEGER NULL). Чистого внимания на 3 задачи - 12 минут вместо 2 часов.

(скриншот: 3 терминала с Codex параллельно)

Нюанс. Параллельность работает только на задачах, которые не пересекаются по файлам. Две задачи на один модуль - конфликт неизбежен.

Claude Code Max умеет sub-agents через Task tool, но они работают внутри одной сессии, едят weekly limit втрое быстрее и требуют присутствия в чате. Codex async-инстансы работают независимо. Другая архитектура.

Задача №3: boilerplate где не нужна глубина

Каждую неделю прилетает 10-15 задач уровня «сделай ещё один эндпоинт по тому же паттерну», «накати миграцию по шаблону». Рутина без глубокого мышления.

Замер месяц назад: на такие задачи уходило ~30% времени Claude Code Max. Opus 4.7 на простой CRUD сжигает токены на размышления, которых не требуется.

Переехал на Codex с reasoning=low для рутины. Цифры:

  • Стоимость. Max $200/мес vs Codex Plus $20/мес. На рутине разницы в качестве не вижу (проверял слепым сравнением 12 раз). Codex дешевле в 10×.
  • Скорость. GPT-5.x medium на рутине быстрее Opus 4.7 в 1.5-2 раза.
  • Токены. По данным pillar-материала, Codex использует ~в 4 раза меньше токенов. За май на Codex Plus ни разу не упёрся в weekly cap.

Что отдаю в Codex с reasoning=low: CRUD-эндпоинты по паттерну, React-компоненты по дизайн-системе, миграции БД без хитрой логики, скрипты импорта данных, cron-задачи по шаблону.

Что не отдаю даже на простой задаче: авторизация, токены, пароли; платёжная система; email-шаблоны клиентам (там юр. лексика).

На рутине Codex Plus $20 экономит ~$80 в месяц лимитов Max. Вторая подписка окупает себя в 4 раза.

Задача №4: миграция и cleanup в фоне

Long-running задачи, которые я готов отдать на час и не следить.

Прошлая среда. В репозитории накопился dead code: 47 неиспользуемых функций, ~6000 строк по 23 файлам. Нудная работа - проверить каждую функцию через grep, потом удалять.

В Claude Code Max раньше: открывал сессию, отвечал на 8-12 вопросов «эту функцию точно можно удалить?». Чистого внимания - 1.5 часа на 6000 строк.

В Codex с reasoning=high дал задачу: «прочеши проект на dead code через grep, удали уверенные, остальное в TODO с указанием почему сомневаешься». Ушёл в эфир. Через 40 минут готов diff: 41 функция удалена, 6 в TODO с пометками типа «используется через dynamic require в build.js, не уверен».

(скриншот: Codex закончил cleanup, 41 функция удалена, 6 в TODO)

Просмотрел 6 TODO за 10 минут, 4 удалил, 2 оставил. Итого: 1.5 часа моего внимания превратились в 50 минут. В это время я вёл эфир на 200 человек.

Тот же паттерн работает на миграциях БД, чистке legacy, переименовании сущностей, обновлении зависимостей с правкой ломающих изменений.

Правило: задача требует >30 минут механической работы без архитектурных решений - всегда Codex async. Моё время дороже подписки.

Где Codex проигрывает Claude Code (правда которая режет)

Обратная сторона. Неделю пытался полностью переехать на Codex и понял: в 3 типах задач возвращаюсь в Claude Code. Возвращаюсь потому что Codex там физически слабее, а не из-за привычки.

Архитектурные решения. Когда думаю «как устроить новый модуль», мне нужен собеседник. Claude Code задаёт уточняющие вопросы: «синхронная или асинхронная обработка?», «состояние в БД или в Redis?», «нужна очередь сообщений?». Диалог дожимает мысль. Codex с тем же prompt'ом сразу пишет код. Решение я должен принять сам, а Codex не помог его принять.

Длинные диалоги «давай переделаем». Работаю над UI продающей страницы. Получаю draft, смотрю: «шапка слишком тяжёлая, давай вторую попытку». В Claude Code это естественный поток правок: «уменьши шапку», «добавь подзаголовок», «верни баннер». Codex async на каждую правку запускает новую sandbox-сессию. Поток мышления разрывается, я теряю темп.

Продуктовое видение. Самый болезненный пример. Когда обсуждаю фичу как продуктовую сущность - «зачем юзеру эта кнопка, как это влияет на воронку» - Claude Code тащит. Opus 4.7 умеет в продуктовое мышление. Codex как инженер делает то, что сказали, но не подсказывает «слушай, тут конфликт с тем, что мы обсуждали вчера».

Отладка edge-case багов с глубоким стеком. На прошлой неделе сидел над багом cron-задачи, где у одного юзера из 2371 двойное списание middleware-токена. Стек уходит на 5 уровней: cron → bot-handler → notification-service → preferences-resolver → user-channel-service. Чтобы поймать причину, нужно дочитать каждый слой, проверить инварианты, развернуть мысль на 4 шага назад. Claude Code в синхронном диалоге задавал уточняющие вопросы и держал гипотезу. Codex брал весь стек, генерил «исправление» в одном слое и шёл дальше - симптом гасил, причину пропускал. Развязал руками за 40 минут в Claude Code, после трёх неудачных попыток Codex.

(скриншот: Plan Mode в Claude Code с уточняющими вопросами по архитектуре)

Если коротко: Codex - executor с амнезией между запусками. Claude Code - партнёр с памятью на сессию. На рутине выигрывает executor. На стратегии выигрывает партнёр.

Поэтому я держу обе подписки. 4 задачи реально сделать только в Codex. 3 задачи реально сделать только в Claude Code.

Сколько это стоит на месяц (цифры из биллинга)

Парадокс в том, что я стал платить больше, а сжигать меньше. Платил $200 за Claude Code Max. Сейчас плачу $200 Max + $20 Codex Plus = $220. На 10% больше по счёту, по факту - меньше денег.

Расклад. До эксперимента в Claude Code Max упирался в weekly cap в среднем 2 раза в месяц. Каждое упирание - либо бросаю задачу до следующей недели, либо беру Anthropic API сверху по ценнику $25 за 1M output-токенов. За май - ~$60 расхода на API сверху подписки. Реальный счёт был $260, не $200.

После переезда части задач в Codex:

  • Claude Code Max: $200, использую на 25-30% объёма. Раньше было 60%.
  • Codex Plus: $20, использую на ~70% подписки.
  • API-доплата сверху Max: $0 за май.
  • Итого: $220 vs $260. Минус $40 в месяц.

Разложил расход по неделям, чтобы понять, на что именно ушли деньги:

  • Неделя 1 (Apr-26 финал): $190 Max (Claude Code разовое продление), $0 Codex - решал на Claude Code всё подряд, упёрся в weekly cap к четвергу, доплатил $14 через Anthropic API.
  • Неделя 2 (May-26 старт): $200 Max, $20 Codex Plus стартовая подписка. Codex 80% времени на boilerplate и cleanup, Claude Code только на архитектуру нового модуля платежей. API-доплата $0.
  • Неделя 3 (May-26 середина): Claude Code Max на 25% использования, Codex Plus на 70%. Все 3 параллельные задачи прошлой пятницы (миграция БД + Actions + README) ушли в Codex async. API-доплата $0.
  • Неделя 4 (May-26 финал): Claude Code Max на 30% (плюс рефакторинг auth-middleware), Codex Plus на 75% (продолжение dead-code cleanup в фоне). Итог $220 за месяц без API-доплаты, чистая экономия $40.

(скриншот: биллинг Anthropic за май, API расход $0)

Объяснение простое: на рутину я перестал тратить дорогой токен Opus 4.7. Рутину делает GPT-5.x medium через Codex, эти токены стоят в ~4 раза меньше. Anthropic в мае поднял weekly limits - я этого даже не замечаю.

Когда я перестал считать Codex «вторым Claude Code» и начал относиться к нему как к фоновому исполнителю, экономика поменялась.

Выводы: что я бы сделал на твоём месте

Если ты сейчас на одной подписке и думаешь, стоит ли пробовать вторую:

  • Возьми Codex Plus за $20 на один месяц. Минимальный билет, чтобы протестировать async-модель на своих задачах. Не Pro $100 сразу - сначала пойми, нужна ли тебе эта модель вообще.
  • Положи в репозиторий tasks-router.md из этого материала. Заведи привычку: перед задачей 10 секунд смотри в router. Через 2 недели у тебя реальная картина, кто что тащит у тебя в проекте.
  • Не пытайся «полностью переехать» на Codex. Типовая ошибка фанатов Claude Code, которые ушли с громким объявлением и через неделю возвращаются. У Codex слабые места жёсткие: архитектура и длинные диалоги.
  • Замерь свой weekly cap на Claude Code до и после. Упираешься в потолок Max - часть нагрузки уйдёт в Codex, проблема исчезнет. Меньше упираешься в Max - меньше доплачиваешь за API.
  • Не доверяй Codex на чувствительной безопасности и платежах. Туда не отдаю авторизацию, оплаты, юр.-критичную email-переписку. Async-модель плохо ловит контекст «здесь нельзя ошибаться».
  • Если работаешь в команде, распредели роли по уровню. Codex с reasoning=low хорошо ложится на джунов и middle-задачи (CRUD, миграции, тесты по шаблону) - там нет рисков «уехать в архитектуру». Claude Code в Plan Mode оставь лидам и senior-разработчикам: продуктовые обсуждения, выбор паттернов, security review. Один человек в проекте - просто держи оба инструмента под себя и переключайся по router'у.

За 3 недели стало очевидно: спор «Codex или Claude Code» в 2026 году бессмысленен. Это два инструмента под разные классы задач. Через год вопрос будет «сколько у тебя async-агентов в фоне работает», а не «какой агент главный». Async-агенты становятся базовой инфраструктурой работы программиста, как раньше ей стали IDE и git.

А ты под какие задачи держишь два инструмента или хватает одного? Напиши в комментариях, какая твоя пятая категория, которую я не описал.

Начать дискуссию