Как перестать упираться в лимиты Claude

Если вы используете Claude регулярно, то полюбому знаете это чувство. Середина рабочей сессии, всё идёт хорошо и бах, лимит на несколько часов. Пу-пу-пу

Нашёл системное решение на просторах твиттера. Вот что реально работает.

Самая частая ошибка: использовать Opus для брейнсторминга.

Текстовые чаты почти не жгут токены. Код, генерация, сложные задачи — вот что опустошает лимит.

Правило простое:
Haiku для планирования → Sonnet для средних задач → Opus только для финального выполнения и курации.

В Claude Code есть специальный Plan Mode — Shift + Tab дважды или /Plan. Он заставляет Claude думать перед тем как делать.

Два человека делают одно приложение.

Первый тратит 2 минуты на планирование и перестраивает три раза. Второй тратит 20 минут на планирование и строит один раз. Второй экономит ~67% токенов на задаче.

Когда ты продолжаешь один длинный чат — Claude каждый раз перечитывает весь старый контекст. Это токены. И это снижает качество ответов — релевантность падает от объёма ненужной информации.

Решение: Projects + новые чаты внутри них.

Вместо одного бесконечного чата — проект с несколькими короткими. Каждый новый чат внутри проекта понимает твои инструкции, но не тащит за собой лишний контекст.

Бонус: добавь в инструкции проекта фразу вроде "Я стараюсь экономить токены — давай краткие ответы и подсказывай когда лучше начать новый чат." Claude сам будет помогать оптимизировать.

"Be cognisant of the fact I'm trying to save account usage. Be concise in your answers, and when appropriate, advise me on when I should start a new chat or any other tips that may help me reduce token usage."

Три коротких чата всегда лучше одного длинного. Даже бывшая жена мне так говорила.

По умолчанию Claude забывает всё между сессиями. Ты объясняешь одно и то же снова и снова — это пустые токены.

Быстрое решение: два markdown-файла в папке.

Instructions.md — твои правила, стиль, контекст кто ты. Добавь строку: "Обновляй Memory.md моими предпочтениями со временем."

Memory.md — живой мозг Claude. Сюда он записывает что узнал о тебе: предпочтения, исправления, паттерны.

Сказал "не используй тире" — Claude читает инструкции, идёт в Memory.md, обновляет. В следующий раз помнит. Но в этот раз я не сказал и уже задолбался его убирать из текста. Сорри

Подключи папку к Claude Code или Cowork — и система работает автоматически.

Несколько вещей которые большинство не знает:

Extended Thinking — выключи по умолчанию. Включай только когда реально нужно.

Стили — на главной странице Claude есть раздел Styles. Переключи на "Concise" — короткие ответы, меньше токенов.

Low Effort в Claude Code — для большинства задач достаточно режима Low. Не трать Opus на задачи которые Haiku решит за секунду.

Не бойся других моделей — Kimi, DeepSeek отлично справляются с простыми задачами вроде поиска и ресёрча. Оставь Claude для того где он реально нужен.

Мало кто знает: Claude Code и Claude Chat тянут из одного общего лимита. Claude Design — отдельный лимит.

Не трать токены Claude Code на дизайн если у тебя лежат неиспользованные токены Claude Design.

Дополнительно: в Claude Code есть команда /usage — проверяй где ты находишься. Не жди пока упрёшься в стену.

Коротко: система

Планируй на Haiku → строй на Sonnet → финализируй на Opus. Короткие чаты в проектах вместо одного длинного. Два markdown-файла для памяти. Concise стиль включён. Разные инструменты для разных задач.

Три недели без единого лимита — реально.

Как перестать упираться в лимиты Claude

Шаг 1. Планируй на дешёвой модели, а строй на дорогой

Шаг 2. Длинные чаты — тихий убийца лимитов

Шаг 3. Дай Claude нормальную память

Шаг 4. Правильный выбор модели

Шаг 5. Разные инструменты — разные лимиты