«Потокенмаксили» — и хватит: как компании сначала вынудили разработчиков бездумно жечь токены, а теперь вводят лимиты
Потому что всё-таки считают деньги.
Весной 2026 года в ИТ-сообществе появился термин «токенмаксинг» (tokenmaxxing) — это стремление превратить потребление ИИ-токенов в метрику производительности: якобы чем оно выше, тем активнее бизнес использует нейросети.
Чтобы подстегивать сотрудников, некоторые компании внедрили геймификацию и запустили внутренние рейтинги самых активных пользователей ИИ. А глава Nvidia Дженсен Хуанг в подкасте All-In заявил, что «всерьёз обеспокоится», если инженер с окладом в $500 тысяч в год расходует на токены менее $250 тысяч в год.
Токен-тревожность
За 30 дней суммарный расход токенов в корпоративном рейтинге Meta* превысил 60 трлн. Показатель лидера таблицы за этот же месяц составил 281 млрд токенов. Если считать по тарифам самой дешёвой версии Claude Opus 4.6 ($5 за 1 млн токенов), только его запросы обошлись Meta* более чем в $1,4 млн.
Автор ИТ-рассылок The Pragmatic Engineer Гергей Орош отмечал, что в крупных компаниях отказ как можно быстрее внедрить ИИ в работу, каким бы ни было качество результата, — потенциальный карьерный риск.
Партнёр инвестиционной FPV Ventures Никундж Котари в своём блоге Balancing Act описывает состояние части разработчиков термином «токен-тревожность»: они переживают из-за показателей и поэтому начинают круглосуточно жечь токены ради псевдопродуктивности.
Я сам заменил Netflix на Claude Code. Лежу в кровати и думаю о том, что можно запустить перед сном — что будет работать, пока я в отключке. Чтение книг теперь кажется непозволительной роскошью. Смотреть кино без открытого ноутбука — пустая трата времени.
Голос в голове то и дело твердит "А ведь на фоне могла бы выполняться задачка", хотя я даже не предприниматель. Просто зависим от желания реализовывать свои случайные идеи.
Механики накрутки
Аналитики платформы TrueFoundry рассмотрели частые схемы умышленного перерасхода ИИ-бюджетов. Самая очевидная — «злоупотребление» дорогими моделями для решения простейших задач (Premium-Model Overuse).
По словам авторов, преимущество таких моделей раскрывается в сложных запросах, а в рутинных разница в точности между, например, Claude Haiku и Opus обычно составляет менее 2%. При этом лишние расходы в рамках всего одного рабочего процесса могут достигать $766 тысяч в год.
Ещё одна схема — контекстная нагрузка (Context Stuffing): это когда разработчик загружает массивы разных данных «на всякий случай», вместо того чтобы отдавать боту только действительно необходимую информацию. Например, указывает в промпте репозиторий целиком, создавая ИИ-агента для проверки фрагментов кода, и за счёт этого тратит сразу 500 тысяч токенов.
Наиболее затратный метод — зацикливание ИИ-агентов (Agent Loops). Из-за ошибок в архитектуре агент может бесконечно повторять одни и те же действия. По данным TrueFoundry, один такой агент способен сжечь дневной ИИ-бюджет всей команды меньше чем за час. А Tom's Hardware отмечает, что автономные агенты в принципе потребляют в 1000 раз больше токенов, чем стандартные чат-боты.
Отмена дашбордов
К концу мая 2026 года технологическим гигантам пришлось менять стратегию из-за неконтролируемого роста расходов на API, или же «кризиса ИИ-затрат».
Для отслеживания метрик сотрудники даже завели неофициальный рейтинг KiroRank, но Amazon его в итоге закрыла, а старший вице-президент компании Дэйв Тредвелл прямо попросил инженеров остановиться и «использовать ИИ для решениях проблем бизнеса и создания инноваций, а не просто ради использования ИИ».
Нецелесообразность токенмаксинга подсветило исследование платформы Jellyfish. Аналитики получили доступ к внутренним данным крупных ИТ-компаний и сравнили два показателя: объём потраченных токенов и выполненной работы (её измеряли в готовых фрагментах кода). 10% самых активных пользователей ИИ сжигали в несколько раз больше токенов, чем «средний» разработчик (225 млн токенов в неделю против 32 млн). Однако готового кода они выдавали всего в два раза больше.
Глава ИИ-исследований Jellyfish Николас Арколано назвал подход нерациональным: «Вместо того чтобы заранее продумать правильный способ что-то сделать, я поручаю пяти ИИ-агентам создать это “что-то” пятью разными способами и выбираю победителя, по сути, выбрасывая кучу работы». Арколано отмечает, что даже при высокой скорости разработки такой бесконтрольный рост расходов на токены вызывает недовольство у финансовых директоров.
Операционный директор Uber Эндрю Макдональд заявил, что рост расходов на ИИ пока что не обеспечил соразмерного увеличения продуктивности, при этом разработчики полностью сожгли годовой бюджет на Claude Code всего за четыре месяца. Uber пришлось ввести ограничения — теперь каждому инженеру выделяют лимит на оплату токенов: до $1500 в месяц.
Microsoft пошла дальше и обязала разработчиков Windows, Teams и Outlook отказаться от дорогостоящего Claude и перевести проекты на собственный, более дешёвый аналог — Microsoft Copilot.
Поиск компромисса
Альтернативой токенмаксингу рассматривают концепцию Outcome Maxxing — фокус на результатах. Гендиректор HubSpot Ямини Ранган предложила отказаться от оценки сотрудников по объёму сожженных токенов и внедрять ИИ только там, где он может улучшить бизнес-показатели: принести больше качественных лидов, повысить конверсию, ускорить работу команд.
Переходить в режим экономии готовы не все. Партнёр фонда Sequoia Соня Хуанг и глава ИИ-стартапа Writer Мэй Хабиб считают большие счета за API платой за конкурентное преимущество. Согласование бюджетов замедляет работу и позволяет конкурентам быстрее выпускать продукты.
Но профессор прикладного ИИ в бизнес-школе EGADE Кристофер Санчес считает спор ошибкой и предлагает бизнесу компромисс — разделять ИИ-бюджеты в зависимости от типа рабочих процессов.
По мнению Санчеса, компании должны безлимитно сжигать токены только в четырех сценариях:
- При изучении возможностей и тестировании новых нейросетей.
- При поиске решений для критически важных задач.
- Для сбора уникальной аналитики и изучения пределов самих алгоритмов.
- Ради максимального ускорения разработки, когда время выхода на рынок важнее стоимости токенов.
Руководство компаний должно вручную определить статус каждого процесса. Только так они смогут продолжать одновременно инвестировать в инновации и сдерживать пустую трату денег на имитацию работы.
*Meta признана в России экстремистской организацией и запрещена.