$2,60 vs $1,70 в Claude Code: одна команда срезала треть бюджета. Это opusplan

$2,60 vs $1,70 в Claude Code: одна команда срезала треть бюджета. Это opusplan

Сидел три недели на Opus 4.7 по умолчанию в Claude Code. Думал: «беру лучшее, проблем не знаю». В конце месяца открыл /usage и увидел $340. Закрыл вкладку, пошёл за кофе, потом полез разбираться куда оно уходит. Нашёл одну команду внутри самого Claude Code, про которую Anthropic особо не пиарит. Она режет счёт на треть, не трогая качество. И никто из знакомых разработчиков о ней не знал.

Команда называется opusplan. Я три недели её игнорировал, потому что она спрятана в выпадающем меню /model между обычным Opus и Sonnet. Третий пункт списка, выглядит непримечательно, никто не объясняет зачем он там. Внутри это гибрид, который думает Opus'ом и пишет Sonnet'ом. Ниже разберу как он устроен, на какой задаче я его померил по конкретным $, где он ломается и как сделать его умолчанием через settings.json.

Как включить opusplan: одна команда, копировать и применять

Запуск из новой сессии:

claude --model opusplan

Если уже сидишь в сессии и хочешь переключиться на лету:

/model opusplan

Всё. Никаких флагов, никаких конфигов, никаких API-ключей. Дальше Claude Code сам решает что отдать Opus'у, а что Sonnet'у. Тебе как пользователю это вообще не видно - отвечает один агент, как обычно.

Я померил на конкретной задаче: рефакторинг старого сервиса оплат, 50 шагов с правками в 9 файлов. Прогнал дважды - один раз чистым Opus 4.7 по умолчанию, второй раз через opusplan. Цифры из /usage:

  • Только Opus 4.7: $0,35 на план + $2,25 на код = $2,60 за сессию
  • opusplan (Opus + Sonnet): $0,35 на план + $1,35 на код = $1,70 за сессию

Экономия 35% на одной сессии. Качество - то же самое. Тот же рефакторинг, те же тесты, тот же diff. Я честно вёл diff обоих прогонов глазами - структурно идентично. Sonnet в opusplan не косячит, потому что план уже разложен Opus'ом до конкретных шагов.

Если хочешь увидеть свою цифру до и после - открой Claude Code, выполни задачу на чистом Opus, посмотри /usage, повтори через opusplan, сравни. Я бы поспорил что у тебя выйдет от 30% до 50% экономии в зависимости от размера задачи.

Что внутри opusplan: Opus думает, Sonnet делает

Я три дня не понимал почему это работает. Раз Sonnet хуже Opus, почему гибрид не теряет в качестве? Полез в Claude Code Docs и понял механику.

Когда Claude Code получает задачу, он внутри себя проходит две фазы. Сначала - планирование: разобраться что просят, разложить на шаги, понять архитектурные риски, найти зависимости. Это требует глубоких размышлений по всей кодовой базе сразу. Здесь Opus реально нужен - он держит контекст и видит неочевидные связи. Сэкономишь тут - получишь кривой план и потом будешь переделывать.

Вторая фаза - исполнение: написать конкретные строки кода по уже разложенному плану. Тут глубокие размышления не нужны. Нужна аккуратность, синтаксис, следование инструкции. Sonnet 4.6 справляется на уровне Opus - он выдаёт 91% качества Opus при 40% его цены. Когда план готов до конкретных шагов, разница между моделями на уровне написания одной функции околонулевая.

opusplan именно так и устроен внутри. Opus планирует, Sonnet кодит. Ты как пользователь видишь один диалог, один ответ, один результат. Внутри сидят два движка. Anthropic в документации формулирует мягко:

«hybrid execution with planning by larger model and writing by faster model» - Claude Code Docs, раздел «Model selection»

В переводе: «гибридное исполнение, где большая модель планирует, а быстрая - пишет». По-русски это «дай Opus'у думать о сложном, а Sonnet'у дай печатать».

У этой механики есть забавный побочный эффект. Sonnet в opusplan пишет код лучше чем Sonnet в одиночном режиме. Моделька та же самая, но в гибриде Opus уже разжевал задачу до конкретики. Sonnet в одиночку часто додумывает архитектурные решения сам и косячит на них. В opusplan он этого не делает, потому что план уже разжёван.

Где opusplan ломается: 200K контекста, нет апгрейда до 1M

Сразу скажу что НЕ работает, чтобы ты не наступил на грабли как я.

Первое и главное: plan-mode Opus в режиме opusplan работает со стандартным контекстом 200K токенов. Автоматический апгрейд до 1M, который доступен на алиасе opus, на opusplan НЕ распространяется. Это документированное ограничение Anthropic.

Что это значит на практике. Если у тебя проект средний (до 100K строк кода) - ты этого не заметишь, 200K хватает с запасом. Если у тебя монорепо на 500K+ строк, и ты хочешь, чтобы Opus в плане держал в голове сразу 30+ файлов из разных модулей - opusplan начнёт обрезать контекст. План получится поверхностный, Sonnet потом будет править то, что должно было быть учтено на этапе плана. Я обжёгся на этом, когда пытался прогнать opusplan на большом старом проекте - он начал переписывать модуль, не зная про зависимости в соседнем. Пришлось вернуться на чистый Opus с 1M контекстом.

Второе: opusplan не подходит для задач, где код пишется итеративно с обсуждением. Если ты сидишь в режиме «придумай-обсуди-перепиши-обсуди» - Sonnet начнёт терять нить второго и третьего раунда. Opus в чистом виде держит обсуждение лучше. В моих задачах это срабатывает в архитектурных дискуссиях, где я меняю требования по ходу - opusplan тут проседает.

Третье: для отладки сложного бага с непонятной причиной opusplan тоже не подходит. Когда непонятно где причина, нужны глубокие размышления по всей кодовой базе на каждом шаге расследования - это работа Opus. Sonnet в opusplan начнёт предлагать поверхностные гипотезы, потому что «план» в этой задаче меняется каждые 30 секунд.

Полная карта решений «какой режим для какой задачи» - в моём гайде Sonnet или Opus 4.7 в Claude Code: выбор модели и /effort в 2026. Там я разбираю 12 типовых задач и привязываю к каждой свой режим - с конкретными цифрами расхода токенов и обоснованием выбора.

Краткое правило: opusplan - для ежедневного кодинга на проекте до 100K строк, когда задача укладывается в одну сессию без 5+ раундов обсуждения. Для всего остального - обычный opus или режим xhigh с максимальной глубиной размышлений.

Как зашить opusplan в settings.json и забыть

Запускать каждый раз claude --model opusplan раздражает. Я через неделю прописал его умолчанием, и теперь не думаю.

Способ первый, самый простой. В выпадающем меню /model подсветить строку opusplan и нажать d. Claude Code запомнит выбор для будущих сессий. Внутри он создаст или обновит файл ~/.config/claude/settings.json со строкой "model": "opusplan".

Если хочешь править руками - открой ~/.config/claude/settings.json и положи туда:

{ "model": "opusplan", "effortLevel": "high", "fastMode": false }

Поле effortLevel управляет глубиной размышлений на каждом шаге. У Claude Code три уровня:

  • low - короткие задачи без интеллектуальной нагрузки. Поправить опечатку, перенести функцию.
  • high - баланс токенов и качества. Стандартный уровень для Sonnet 4.6 в opusplan.
  • xhigh - лучшие результаты для сложных кодерских задач. Доступен только на Opus 4.7, в opusplan срабатывает на этапе плана.

Уровень high обычно достаточный. xhigh я ставлю руками через /effort xhigh только когда заранее знаю что задача архитектурная и Opus реально нужно думать дольше.

fastMode: false оставь как есть. Быстрый режим на Opus стоит $30/$150 за миллион токенов - это в 6 раз дороже стандартного Opus. Окупается только если у тебя горящий срок и ты готов платить за 2,5× ускорение ответа.

Через переменную окружения тоже можно - CLAUDE_CODE_EFFORT_LEVEL=high в .zshrc или .bashrc, и тогда уровень размышлений подтягивается из окружения. Я так и сделал на рабочем ноуте.

Проверка что всё применилось: открой новую сессию Claude Code, набери /model без параметров - должен показать opusplan как текущий выбор и пометку «по умолчанию» в скобках.

Почему 80% разработчиков не знают про opusplan: алиас спрятан в меню

Когда я писал этот текст, я поспрашивал знакомых вайб-кодеров и разработчиков с подпиской Claude Max - про opusplan слышали трое из пятнадцати. Двое использовали, один пробовал и забыл. Остальные сидят на стандартном opus, потому что «беру лучшее, не парюсь». На этом пользовательском паттерне Anthropic зарабатывает основные деньги.

Стандартная модель в Claude Code при подписке Max - это opus. Если ты подписался месяц назад и ни разу не лазил в /model - у тебя там сейчас opus. Никакого введения про opusplan нет. В приветственном сообщении при первом запуске про него тоже не пишут. В Anthropic Docs opusplan упомянут одним абзацем в разделе про гибридное исполнение - туда заходят те, кто целенаправленно ищет.

Получается ситуация: вышел отдельный режим, который экономит пользователю треть бюджета без потерь в качестве, но он спрятан так, что 80% подписчиков о нём не знают. Anthropic при этом не теряет в выручке - пользователи на стандарте платят полный Opus.

Я не пишу про злой умысел. Anthropic явно проиндексировал стоимость инференса и понимает, что если 80% подписчиков переключатся на opusplan - юнит-экономика просядет. Им проще оставить хороший режим спрятанным в меню и не пиарить. Один раз нашёл - сэкономил. Не нашёл - продолжаешь оплачивать чужую экономию.

С другой стороны, для нас как для пользователей это значит, что одного клика в /model opusplan достаточно, чтобы убрать треть статьи расходов на ИИ. Я не знаю много фич с такой отдачей на единицу усилия.

Ещё одна деталь про новый Opus 4.7. У него поменялся токенизатор - теперь на том же тексте Opus может потреблять до 35% больше токенов, чем Opus 4.6. То есть номинальная цена $5/$25 за миллион - это не та же самая цена, что была на 4.6. Реальный счёт на 4.7 растёт сильнее, чем разница в номинале. opusplan это компенсирует - Sonnet 4.6 с тем же токенизатором что и раньше, экономия идёт по обоим осям.

Что я вынес за месяц на opusplan: 3 правила выбора модели

Через месяц использования у меня сложилось три простых правила.

Правило первое: opusplan - по умолчанию для ежедневного кодинга. Не «иногда», не «когда подумаю», а именно по умолчанию. Прописал в settings.json и забыл. На неделе из 40 рабочих часов в Claude Code это сэкономит тебе на круг 30-40% бюджета без потери качества. Если ты разработчик соло - это разница между «$200 за подписку и $0 в API» и «$200 за подписку + $150 в API». Если команда из 10 человек - это $500-700 в месяц на команду, как считает гайд про экономию токенов.

Правило второе: переключаться на чистый opus руками только в трёх ситуациях: отладка непонятного бага, архитектурная дискуссия с обсуждением требований по ходу, проект больше 100K строк где нужен 1M контекст. Во всех остальных случаях opusplan достаточен.

Правило третье: новый токенизатор Opus 4.7 - это скрытая инфляция. Если ты сидел на 4.6 и решил «обновлюсь, дороже не станет», ты ошибаешься на 20-35% в зависимости от типа задачи. opusplan минимизирует эффект, потому что код в нём пишет Sonnet со старым токенизатором.

Через год я ожидаю, что гибридные режимы станут стандартом во всех редакторах с ИИ-помощниками. Cursor уже двигается в эту сторону, GitHub Copilot тестит автопереключение моделей в корпоративной версии. Anthropic первый сделал это явным и доступным через одну команду. За год использования opusplan соло-разработчик экономит десятки тысяч рублей. Команда из 10 человек экономит полмиллиона. Те, кто продолжает сидеть на чистом Opus, эти суммы дотируют.

Полный набор правил «как не сжечь лимиты Claude Code за день» я разбирал отдельно - там 8 правил включая subagents, бюджет на контекст и автопереключение моделей: Как не сжечь лимиты Claude Code за день: 8 правил экономии токенов в 2026.

А теперь вопрос. Открой свой /usage в Claude Code и посмотри сколько уходит за прошлый месяц на Opus. У меня было $340. У тебя сколько? И ты слышал про opusplan до этого текста или сейчас впервые?

1
Начать дискуссию