Claude Code и MCP: как lazy loading экономит 95% контекста и почему это меняет правила для AI-агентов

Если вы работаете с Claude Code и подключаете MCP-серверы — вы, скорее всего, теряете большую часть контекстного окна, даже не подозревая об этом. В апреле 2026 года Anthropic выкатила обновление, которое эту проблему решает. Разбираюсь, что изменилось и почему это важно не только для разработчиков.

MCP (Model Context Protocol) — это способ подключить к Claude внешние инструменты: GitHub, браузер, базы данных, файловые системы, PDF-ридеры, поисковики. Каждый MCP-сервер при подключении отправляет описания всех своих инструментов в контекстное окно модели. Это как загрузить инструкцию к каждому инструменту в ящике, прежде чем начать чинить кран.

Один сервер — ок, пара килобайт. Три — терпимо. Но когда серверов 8–10 (а для серьёзной работы это норма — GitHub + браузер + файлы + поиск + база данных + PDF + Slack + почта), описания инструментов занимали до 67 000 токенов. Это до начала работы. До того, как вы задали первый вопрос.

На практике это выглядело так: вы просите Claude проанализировать код, а он забывает контекст вашей задачи на полпути. Не потому что глупый — а потому что 30–40% его «оперативной памяти» было забито инструкциями, которые ему прямо сейчас не нужны.

В апреле 2026 (Week 14, версии 2.1.91+) Anthropic добавила два ключевых изменения.

Lazy loading описаний инструментов. Вместо загрузки всех описаний при старте, Claude теперь загружает облегчённый поисковый индекс. Когда модели нужен конкретный инструмент — она подгружает его описание по запросу. Остальные не трогает.

Механика: система анализирует ваш запрос, матчит ключевые слова, подгружает только релевантные инструменты. Загруженные инструменты остаются в сессии — повторно подгружать не надо.

Порог включения: активируется автоматически, когда описания инструментов превышают 10% контекстного окна. Для большинства конфигураций с 5+ серверами — это происходит всегда.

Лимит результатов 500 000 символов. Раньше большие ответы от MCP-серверов (схема базы данных, дерево файлов, длинный лог) обрезались и сохранялись на диск. Теперь авторы MCP-серверов могут указать лимит до 500 000 символов на инструмент. Результат остаётся в контексте, а не уходит в файл.

Anthropic и независимые разработчики замерили эффект:

— Контекст при старте: экономия до 95%. В одном реальном кейсе — с 51 000 токенов до 8 500. — Точность на Opus 4: с 49% до 74% на MCP-бенчмарках с большими библиотеками инструментов. — Точность на Opus 4.5: с 79,5% до 88,1%. — Максимальное описание инструмента: ограничено 2 КБ (защита от раздутых автогенерированных OpenAPI-серверов).

То есть lazy loading не просто экономит место — он улучшает качество ответов. Модель лучше работает, когда не перегружена ненужной информацией. Логично, но приятно видеть в числах.

До обновления: 3 MCP-сервера — это потолок без потери качества. Хочешь больше — жертвуй контекстом.

После: 10+ серверов — рабочая норма. Можно собирать полноценные пайплайны: поиск + документы + код + браузер + файлы + база — и Claude не захлёбывается.

Для разработчиков это означает, что MCP из «прикольной фичи» превращается в реальную инфраструктуру для AI-агентов. Раньше приходилось выбирать — или много инструментов, или качественная работа. Теперь — и то, и другое.

Для бизнеса — AI-агенты, которые реально работают с несколькими системами одновременно (CRM + почта + документы + мессенджер), стали технически возможны без костылей.

Обновите Claude Code до последней версии (2.1.91+). Lazy loading включается автоматически — ничего настраивать не нужно. Подключите 10+ серверов и проверьте — контекст больше не взрывается.

Если вы автор MCP-сервера и ваш инструмент возвращает большие данные — добавьте аннотацию "anthropic/maxResultSizeChars": 500000 в tools/list. Это позволит результатам оставаться в контексте, а не уходить на диск.

Источники: Anthropic Claude Code Changelog Week 14 (апрель 2026), Claude Code Documentation (code.claude.com), claudefast blog, Medium (@joe.njenga — 46.9% context reduction case study)

Больше практики с Claude и AI-агентами — в Telegram: Горилла под капотом

Claude Code и MCP: как lazy loading экономит 95% контекста и почему это меняет правила для AI-агентов

Проблема: MCP-серверы съедали контекст ещё до начала работы

Что изменилось: Tool Search и lazy loading

Числа

Что это значит на практике

Как попробовать