Бюджет на ветер. Как Claude 5 Sonnet втихую сжигает ваши деньги на внутренний монолог

Первые восторги от релиза Claude 5 Sonnet поутихли, и разработчики по всему миру массово расчехлили калькуляторы. Независимые тесты от Artificial Analysis вскрыли неприятную правду, новая модель может сожрать ваши лимиты и обнулить баланс в API гораздо быстрее, чем вы планировали.

Разбираемся, где зарыт подвох и как правильно крутить настройки, чтобы не остаться без штанов.

Главная фишка Sonnet 5 это глубинное адаптивное рассуждение в фоне. Когда вы кидаете ей сложную логическую задачу, она включает режим жесткого мыслителя, проверяя и перепроверяя саму себя.

Пример из тестов. На одну тяжелую архитектурную таску модель сжигает 69 000 токенов. Из них 56 000 токенов уходит исключительно на её внутренние размышления и скрытый монолог!

Для сравнения, старый добрый Opus 4.8 решает ту же самую задачу, тратя всего около 41 000 токенов. Получается парадокс, на бумаге прайс Sonnet 5 за миллион токенов выглядит сладко, но из-за своей дикой болтливости итоговый чек за сложный запрос выходит практически таким же, как у дорогого Opus. Модель стала невероятно умной, но чертовски прожорливой.

Теперь вся экономия напрямую зависит от нового ползунка Effort в настройках API или интерфейса. Возьмите за железное правило постоянно переключать его под тип задачи, как коробку передач в тачке:

Low / Medium (Эконом-режим). Идеально для генерации текстов, писем, простых скриптов или базового анализа. Модель отвечает пулей и стоит копейки. Если оставить настройки на максимуме для банальной задачи, Claude начнет часами умничать над тремя строчками текста и мгновенно занулит баланс.
Max / Xhigh (Хардкор и агенты). Включаем только для тяжелой логики, дебага запутанного кода или автономных агентских цепочек. Да, сожрет тонну токенов, но зато за один проход сама прогонит тесты, найдет баги, залезет в терминал и выдаст готовый рабочий результат. Тут переплата оправдана, это экономит часы ручной работы.

До 31 августа 2026 года Anthropic демпингует и держит промо-тарифы на API, чтобы дать разработчикам время адаптироваться к новым аппетитам модели:

Вход (Input): $2 за 1 млн токенов.
Выход (Output + мысли): $10 за 1 млн токенов.

Пока действует эта скидка, даже прожорливые задачи на Sonnet 5 выходят на 30–33% дешевле, чем на Opus. Но расслабляться не стоит, уже в сентябре халява кончится, ценник поднимут до стандартных $3/$15, и без контроля настроек Effort в API делать будет нечего.

Sonnet 5 инструмент топовый, но он больше не прощает работу на дефолтных настройках. Не давайте модели слишком много думать там, где нужно просто написать шаблонный код.

Не отставайте от технологий! Подписывайтесь на Telegram-канал, чтобы быть в курсе последних трендов и лайфхаков.

Бюджет на ветер. Как Claude 5 Sonnet втихую сжигает ваши деньги на внутренний монолог

Где прячутся расходы?

Коробка передач для ИИ - настраиваем Effort

Промо-тарифы. Временная подушка безопасности