Как перестать упираться в лимиты Claude

Если вы используете Claude регулярно, то полюбому знаете это чувство. Середина рабочей сессии, всё идёт хорошо и бах, лимит на несколько часов. Пу-пу-пу

Как перестать упираться в лимиты Claude

Нашёл системное решение на просторах твиттера. Вот что реально работает.

Шаг 1. Планируй на дешёвой модели, а строй на дорогой

Самая частая ошибка: использовать Opus для брейнсторминга.

Текстовые чаты почти не жгут токены. Код, генерация, сложные задачи — вот что опустошает лимит.

Правило простое:
Haiku для планирования → Sonnet для средних задач → Opus только для финального выполнения и курации.

Как перестать упираться в лимиты Claude

В Claude Code есть специальный Plan Mode — Shift + Tab дважды или /Plan. Он заставляет Claude думать перед тем как делать.

Два человека делают одно приложение.

Как перестать упираться в лимиты Claude

Первый тратит 2 минуты на планирование и перестраивает три раза. Второй тратит 20 минут на планирование и строит один раз. Второй экономит ~67% токенов на задаче.

Шаг 2. Длинные чаты — тихий убийца лимитов

Когда ты продолжаешь один длинный чат — Claude каждый раз перечитывает весь старый контекст. Это токены. И это снижает качество ответов — релевантность падает от объёма ненужной информации.

Решение: Projects + новые чаты внутри них.

Вместо одного бесконечного чата — проект с несколькими короткими. Каждый новый чат внутри проекта понимает твои инструкции, но не тащит за собой лишний контекст.

Бонус: добавь в инструкции проекта фразу вроде "Я стараюсь экономить токены — давай краткие ответы и подсказывай когда лучше начать новый чат." Claude сам будет помогать оптимизировать.

"Be cognisant of the fact I'm trying to save account usage. Be concise in your answers, and when appropriate, advise me on when I should start a new chat or any other tips that may help me reduce token usage."

Три коротких чата всегда лучше одного длинного. Даже бывшая жена мне так говорила.

Шаг 3. Дай Claude нормальную память

По умолчанию Claude забывает всё между сессиями. Ты объясняешь одно и то же снова и снова — это пустые токены.

Быстрое решение: два markdown-файла в папке.

Instructions.md — твои правила, стиль, контекст кто ты. Добавь строку: "Обновляй Memory.md моими предпочтениями со временем."

Memory.md — живой мозг Claude. Сюда он записывает что узнал о тебе: предпочтения, исправления, паттерны.

Сказал "не используй тире" — Claude читает инструкции, идёт в Memory.md, обновляет. В следующий раз помнит. Но в этот раз я не сказал и уже задолбался его убирать из текста. Сорри

Подключи папку к Claude Code или Cowork — и система работает автоматически.

Шаг 4. Правильный выбор модели

Как перестать упираться в лимиты Claude

Несколько вещей которые большинство не знает:

Extended Thinking — выключи по умолчанию. Включай только когда реально нужно.

Как перестать упираться в лимиты Claude

Стили — на главной странице Claude есть раздел Styles. Переключи на "Concise" — короткие ответы, меньше токенов.

Как перестать упираться в лимиты Claude

Low Effort в Claude Code — для большинства задач достаточно режима Low. Не трать Opus на задачи которые Haiku решит за секунду.

Как перестать упираться в лимиты Claude

Не бойся других моделей — Kimi, DeepSeek отлично справляются с простыми задачами вроде поиска и ресёрча. Оставь Claude для того где он реально нужен.

Шаг 5. Разные инструменты — разные лимиты

Мало кто знает: Claude Code и Claude Chat тянут из одного общего лимита. Claude Design — отдельный лимит.

Не трать токены Claude Code на дизайн если у тебя лежат неиспользованные токены Claude Design.

Дополнительно: в Claude Code есть команда /usage — проверяй где ты находишься. Не жди пока упрёшься в стену.

Коротко: система

Планируй на Haiku → строй на Sonnet → финализируй на Opus. Короткие чаты в проектах вместо одного длинного. Два markdown-файла для памяти. Concise стиль включён. Разные инструменты для разных задач.

Три недели без единого лимита — реально.

1
2 комментария