10 привычек, после которых перестаёшь постоянно упираться в лимиты Claude Code

Самый практичный разбор того, как Claude реально расходует токены, и десять привычек, после которых перестаёшь упираться в лимиты в середине задачи.

Внутри — математика того, почему тридцатое сообщение в чате стоит в 31 раз дороже первого, почему сплитить вопросы — невыгодно, чем Memory отличается от Projects, и как Anthropic перекроил лимиты с 26 марта.

Главная подмена, которая ломает привычки: Claude не считает сообщения. Он считает токены.

Ниже — перевод оригинального гайда (виральный тред с 42 тысячами закладок).

Подписывайтесь на мой канал Ночной Писаревский, где пишу про предпринимательство, AI и делюсь своим опытом.

10 привычек, после которых перестаёшь постоянно упираться в лимиты Claude Code

Большинство винят Claude в строгих лимитах. Я тоже винил.

Потом дошло: Claude не считает сообщения. Он считает токены. Всё, что нужно, — использовать токены с умом. Но мало кто понимает, как именно это устроено, и в итоге сжигает кучу токенов и денег впустую.

Я серьёзно в это закопался и собрал список лучших привычек, которые экономят токены пачками.

1. Редактируй промпт, не шли уточнение следом

Когда Claude не понял твою мысль, есть искушение написать:

  • «Нет, я имел в виду [то-то]»
  • «Блин, не то, я хотел [то-то]»
  • и так далее

Не надо так.

Каждое следующее сообщение добавляется в историю чата. Claude перечитывает ВСЁ это на каждом шагу — сжигая токены на контекст, который даже не помог.

Стоимость сообщения = все предыдущие сообщения + новое.

Итого = S × N(N+1) / 2 (S — средний размер обмена в токенах, N — число сообщений)

При среднем ~500 токенов на обмен:

  • 5 сообщений: 7,5К токенов
  • 10 сообщений: 27,5К токенов
  • 20 сообщений: 105К токенов
  • 30 сообщений: 232К токенов

30-е сообщение стоит в 31 раз дороже первого.

Что делать вместо: жми Edit на оригинальном сообщении → правишь → перегенерируешь. Старый обмен заменяется, а не наслаивается.

10 привычек, после которых перестаёшь постоянно упираться в лимиты Claude Code

2. Открывай новый чат каждые 15–20 сообщений

Из предыдущего раздела понятно, как стоимость растёт с каждым сообщением.

Идеально — открывать новый чат каждые 15–20 сообщений.

А теперь представь чат на 100+ сообщений. При ~500 токенах на обмен это уже больше 2,5 миллиона токенов — большая часть из которых ушла на перечитывание истории.

Один разработчик потрекал свой расход и обнаружил: 98,5% токенов уходило на перечитывание истории. Только 1,5% — на сам ответ.

Когда чат разрастается → просишь Claude сделать саммари всего → копируешь → новый чат → вставляешь как первое сообщение.

3. Сшивай вопросы в один промпт

Многие считают, что разбить вопрос на отдельные сообщения — это про точность. Почти всегда — наоборот.

Три отдельных промпта = три загрузки контекста. Один промпт с тремя задачами = одна загрузка.

Экономишь дважды: меньше перезагрузок контекста и медленнее упираешься в лимит.

Вместо:

  • «Сделай саммари этой статьи»
  • «Теперь выпиши ключевые тезисы»
  • «А теперь предложи заголовок»

Пиши: «Сделай саммари этой статьи, выпиши ключевые тезисы и предложи заголовок.»

Бонус: ответы часто получаются лучше, потому что Claude сразу видит полную картину. Три вопроса. Один промпт. Всегда.

4. Повторяющиеся файлы — в Projects

Если ты загружаешь один и тот же PDF в разные чаты, Claude каждый раз заново его токенизирует.

Вместо этого юзай Projects.

Загрузил файл один раз → он закешировался. Каждый новый разговор внутри проекта ссылается на этот файл, не сжигая токены повторно.

Закешированный контент проекта не ест твой лимит, когда ты к нему обращаешься.

Если работаешь с контрактами, брифами, гайдлайнами или любыми длинными доками — одно это может драматически уронить твой расход.

5. Настрой Memory и User Preferences

Каждый новый чат без сохранённого контекста сжигает 3–5 сообщений на разогрев: «Я маркетолог, пишу в casual-стиле, люблю короткие абзацы…».

Ты наверняка видел, как люди начинают любой промпт с «Act as a…» — это сжигание токенов на повторе. Claude может запомнить это навсегда.

Идёшь в Settings → Memory and User Settings. Сохраняешь свою роль, стиль общения и настройки один раз. Claude автоматически применяет их в каждом новом чате.

6. Выключи фичи, которыми не пользуешься прямо сейчас

Веб-поиск, коннекторы, режим Explore — все эти штуки добавляют токенов в каждый ответ, даже если ты ими не пользуешься.

Пишешь свой текст? Выключи Search and Tools.

Фича Advanced Thinking тоже жрёт токены. Держи её выключенной по дефолту. Включай только если первый ответ не зашёл.

Правило простое: если ты не включал эту фичу осознанно — выключи её.

7. Простые задачи — на Haiku

Проверка грамматики, брейншторм, форматирование, быстрые переводы, короткие ответы — Haiku справляется со всем этим в разы дешевле, чем Sonnet или Opus.

Выбор модели — самое важное решение, которое ты принимаешь каждый день.

Haiku на черновики и простые задачи → высвобождает 50–70% бюджета на задачи, где реально нужны мощные модели.

Ментальная модель:

  • Haiku → быстрые задачи, низкая цена
  • Sonnet → реальная работа, средняя цена
  • Opus → глубокое мышление, высокая цена

Не зови мощные модели на простые задачи.

10 привычек, после которых перестаёшь постоянно упираться в лимиты Claude Code

8. Разноси работу на весь день

Система Claude использует скользящее 5-часовое окно. Оно не сбрасывается в полночь — твой лимит постепенно отпускает. Сообщения, отправленные в 9 утра, перестанут учитываться к 14:00.

Если выжег весь лимит за одну утреннюю сессию — большая часть дневного потолка останется неиспользованной.

Раздели день на 2–3 сессии: утро, день, вечер. К моменту, когда ты возвращаешься, прошлая нагрузка уже не считается, и у тебя свежий лимит.

9. Работай в непиковые часы

С 26 марта 2026 Anthropic начал быстрее съедать твоё 5-часовое окно в пиковые часы:

  • 5:00–11:00 по тихоокеанскому времени / 8:00–14:00 по восточному, в будни.
  • Один и тот же запрос, один и тот же чат — но в пик он сильнее бьёт по лимиту.
  • Недельный лимит остался прежним. Но то, как он распределяется, поменялось. Тяжёлые задачи вечером или в выходные растягивают план в разы.
  • Если ты вне США (Европа, Латам, Азия) — пиковые часы могут попадать на твой день. Перепроверь по часовому поясу.

10. Включи Overage как страховку

На планах Pro, Max 5x и Max 20x в Settings → Usage можно включить фичу Overage.

Когда сессионный лимит выбран, Claude не блокирует доступ. Он переключается на оплату по факту, по тарифам API.

Месячный потолок расходов задаётся отдельно — чтобы не словить неожиданный счёт.

Это не про экономию токенов. Это про то, чтобы не остаться без Claude в худший возможный момент.

Итого

В начале будет тяжело удерживать все 10 правил, но как только они становятся автоматическими — ты почти перестаёшь упираться в лимиты.

Возможно, ты даже сольёшься с Max-плана обратно на обычный — токенов хватит за глаза.

Claude не считает сообщения. Он считает токены.

Подписывайтесь на мой канал Ночной Писаревский, где пишу про предпринимательство, AI и делюсь своим опытом.

Начать дискуссию