Экономим токены - приёмы, которые режут расход токенов в Claude Code (Гайд и обучение Claude Code)

Средний разработчик тратит на Claude Code ~$6 в день. Звучит терпимо — пока не посчитаешь за месяц. Если запускаешь параллельные сессии или работаешь с большой кодовой базой — расход легко улетает за $200-300/месяц. При этом официальная документация прямо говорит: на типичном проекте 80-90% токенового бюджета уходит не на кодинг, а на exploration — чтение файлов, которые Claude мог бы не читать.

Экономим токены - приёмы, которые режут расход токенов в Claude Code (Гайд и обучение Claude Code)

Канал с гайдами и контентом по claude code, выкладываем новости (когда режут лимиты в 10 раз) и какие инструменты через claude реализуем для проектов, канал: https://t.me/claudedevolper

TL;DR: 8 конкретных приёмов для экономии токенов в Claude Code: переключение моделей, агрессивная чистка контекста, .claudeignore, субагенты для тяжёлых операций и точные промпты. Большинство разработчиков сокращают расходы на 40-70%.

1. Переключай модель под задачу

Claude Code по умолчанию работает на Opus — самой мощной и самой дорогой модели. Sonnet стоит в 5 раз дешевле ($3/$15 за миллион токенов вместо $15/$75), а справляется с 80% повседневных задач не хуже.

/model sonnet # для повседневного кода /model opus # сложная архитектура, дебаг на несколько файлов Copy

Для субагентов можно поставить Haiku — он ищет по файлам и отвечает на простые вопросы за копейки:

.claude/agents/quick-search.md---model: haiku --- Copy

Есть и хитрый гибрид — opusplan. Opus рассуждает в режиме планирования, а Sonnet генерирует код:

claude --model opusplan Copy

Качество рассуждений Opus, стоимость генерации Sonnet. Только за счёт правильного выбора модели расход падает на 30-40%.

2. /clear между задачами — самый простой приём

Каждое сообщение Claude обрабатывает ВЕСЬ контекст от начала разговора. Дебажил авторизацию, потом писал тесты, потом рефакторил API в одной сессии — каждый новый запрос таскает весь этот мусор.

/rename auth-debug # чтобы потом найти сессию /clear # полный сброс контекста # начинаем новую задачу с чистого листа Copy

Если понадобится вернуться:

claude --resume # выбрать из списка сессий claude --continue # продолжить последнюю Copy

Правило простое: закончил задачу → /clear → начал новую. Одна команда — и тысячи токенов сэкономлены.

3. Компактируй на 50%, а не на 90%

Claude Code автоматически сжимает историю, когда контекст подходит к лимиту. Но к этому моменту ты уже несколько сообщений переплачиваешь за раздутый контекст, плюс автоматика может потерять важное.

/compact Focus on code samples and API changes Copy

Мониторь заполнение через /cost или настрой status line — и компактируй вручную на 50-70%.

Мощный трюк — частичная компактизация. Жмёшь Esc + Esc (или /rewind), выбираешь точку в разговоре и "Summarize from here". Сжимается только хвост, а начало с важными решениями остаётся нетронутым.

Можно прописать правила компактизации прямо в CLAUDE.md:

Compact instructions When compacting, always preserve the full list of modified files and test commands Copy

Теперь Claude знает, что при сжатии нельзя терять список изменённых файлов и результаты тестов.

4. .claudeignore — 30-100K токенов одним файлом

На стандартном Node.js проекте одна папка node_modules/ может сожрать десятки тысяч токенов при exploration. Файл .claudeignore работает как .gitignore — исключает директории из индексации:

.claudeignore node_modules/ dist/ build/ .next/ coverage/ *.log *.lock __pycache__/ .venv/ Copy

По данным документации, это экономит от 30 000 до 100 000 токенов на стандартном проекте. Бесплатные токены — без единого компромисса в качестве.

5. Субагенты — пусть контекст пухнет у них

Запуск тестов, чтение логов, анализ документации — всё это заливает основной контекст тысячами строк. Субагент работает в изолированном контексте и возвращает только краткое саммари:

Use a subagent to run all tests and report only failures with file paths CopyUse subagents to investigate how our auth handles token refresh Copy

Без субагента: Claude читает 20 файлов → 50K токенов в контексте. С субагентом: те же 20 файлов → в основной контекст попадает саммари на 200 токенов.

Для максимальной экономии запускай субагентов на Sonnet:

export CLAUDE_CODE_SUBAGENT_MODEL=sonnet Copy

Субагенты — один из самых мощных инструментов управления контекстом, потому что решают главную проблему: exploration раздувает контекст, а субагент берёт это раздувание на себя.

6. Тонкий CLAUDE.md + Skills вместо монолита

CLAUDE.md загружается в КАЖДУЮ сессию. Если туда запихнуть инструкции по деплою, гайд по code review и описание архитектуры — это 15 000+ токенов ещё до первого вопроса.

Правило: держи CLAUDE.md под 500 строк. Только то, что нужно всегда:

CLAUDE.md (slim)## Code style- ES modules (import/export), not CommonJS - Destructure imports when possible ## Workflow- Run typecheck after code changes - Prefer single tests over full suite Copy

Всё специфическое — в Skills, которые загружаются по требованию:

.claude/skills/deploy/SKILL.md --- name: deploy description: Deployment workflow and checklist ---# Deploy Process1. Run full test suite 2. Build production bundle ... Copy

По данным claudefa.st, переход от раздутого CLAUDE.md к архитектуре skills + slim CLAUDE.md экономит ~15 000 токенов на сессию — это 82% от прежнего base context.

7. Сократи overhead от MCP серверов

Каждый MCP сервер добавляет описания инструментов в контекст — даже когда ты ими не пользуешься. 10 серверов × 500 токенов = 5000 токенов мёртвого груза в каждом запросе.

/context # что сейчас ест контекст /mcp # какие серверы подключены Copy

Три правила:

  • CLI вместо MCP — gh, aws, gcloud, sentry-cli не добавляют постоянных определений в контекст. Claude запускает их через Bash только когда нужно
  • Отключай неактивные — если из 10 серверов реально используешь 3, остальные 7 просто жрут токены
  • Снижай порог tool search — переменная ENABLE_TOOL_SEARCH=auto:5 автоматически откладывает инструменты, когда они превышают 5% контекста, и подгружает по требованию

8. Точные промпты — экономия на exploration

Размытый запрос заставляет Claude сканировать полпроекта. Конкретный — работать точечно.

  • Дорого: "fix the login bug" → Claude читает всю src/auth/, перебирает файлы
  • Дёшево: "fix the off-by-one error in src/auth/tokenRefresh.ts line 45 that skips the last token" → один файл, одно исправление

Батчинг тоже помогает — объединяй связанные задачи:

Update error handling in auth.js, user.js, and api.js — add try/catch around all DB calls, log errors with request context Copy

Один запрос с тремя файлами вместо трёх отдельных сессий.

И ещё: если нужно разобраться в коде, давай Claude направление поиска. Не "how does auth work?" а "look through src/auth/ git history and summarize how token refresh evolved". Это сокращает количество файлов, которые Claude прочитает.

Бонус: контролируй extended thinking

Extended thinking включен по умолчанию с бюджетом в 31 999 токенов. Thinking tokens — это output tokens, самые дорогие. Для простых задач такой бюджет — чистый перерасход.

export MAX_THINKING_TOKENS=8000 Copy

Или снижай effort level для Opus 4.6 через /model, или отключай thinking через /config для тривиальных задач.

Как мониторить расход

Экономить без цифр — гадание на кофейной гуще. Три инструмента:

  • /cost — расход текущей сессии прямо в терминале
  • ccusage — CLI-анализатор расхода из локальных логов:

npm install -g @ryoppippi/ccusage ccusage daily --breakdown # разбивка по моделям ccusage monthly # итоги за месяц Copy

  • Status line — постоянный индикатор контекста в терминале, настраивается через /config

Кому это важно

  • Разработчику — начни с /model sonnet и /clear между задачами, добавь .claudeignore. Три действия, которые сразу дают 30-40% экономии
  • Тимлиду — при 10 разработчиках и ~$150/мес каждый, правильные настройки экономят $500-700/мес на команду. Пропиши модели и правила компактизации в общий CLAUDE.md
  • Следишь за рынком — контекст-менеджмент становится core skill для AI-разработки. Кто научится управлять токенами — получит тот же результат за долю цены

Как попробовать

  1. Прямо сейчас — переключись на Sonnet: /model sonnet
  2. Создай .claudeignore в корне проекта — исключи node_modules/, dist/, build/, coverage/
  3. Поставь ccusage — npm install -g @ryoppippi/ccusage && ccusage daily — увидишь, сколько тратишь
  4. Попробуй субагента — в следующий раз при прогоне тестов напиши Use a subagent to run tests and report only failures
  5. Документация: Manage costs effectively и Best practices

Claude Code — мощный инструмент, но мощь без контроля — это просто дорогой хаос. Ни один из этих приёмов не требует ничего сложного. Большинство — одна команда или один файл. А результат — 40-70% экономии и счета, которые не пугают в конце месяца.

Канал с гайдами и контентом по claude code, выкладываем новости (когда режут лимиты в 10 раз) и какие инструменты через claude реализуем для проектов, канал: https://t.me/claudedevolper

Экономим токены - приёмы, которые режут расход токенов в Claude Code (Гайд и обучение Claude Code)
Начать дискуссию