«Ты — писать код, я — править»: некоторые разработчики и компании используют режим «пещерного человека» для экономии токенов в Claude Code
В том числе программисты из Nvidia, GitHub и OpenAI.
Сравнение ответов в режиме «пещерного человека» и без него. Источник: GitHub
- Разработчик Джулиус Брусс решил, что сможет сэкономить количество расходуемых токенов в Claude Code и Codex, если ИИ-агент перестанет тратить их на «вежливые» вступления, вводные фразы, предлоги и артикли в английском языке, пишет 404 Media.
- Весной 2026 года он выложил на GitHub открытый проект Caveman, который заставляет ИИ-помощника отвечать сжато, как «пещерный человек». По словам Брусса, теперь им пользуются разработчики из Nvidia, GitHub и OpenAI. Один из сотрудников последней сам добавил в Caveman поддержку Codex.
- Французский поставщик инфраструктуры для дата-центров Legrand во внутренней записке прямо рекомендует сотрудникам использовать Caveman, узнало 404 Media.
- Проект представляет собой markdown-файл с инструкциями для Claude Code, Codex, Gemini и ещё более чем 30 инструментов. Также доступно четыре режима общения: Lite, чтобы убрать лишние вводные слова, Full — для коротких ответов в режиме «неандертальца», Ultra — максимально сжатый, как в почтовой телеграмме и Wenyan — со стилизацией под китайский язык. Стили работают для любого языка, на котором разработчик общается с моделью.
- В тестах Брусса число выходных токенов сократилось на 65-75% по сравнению со стандартным выводом. Специалисты Elastic Labs заявили, что в их тестах расходы снизились на 63,6%.
- Caveman не влияет на число токенов «размышления», только на ответы в чате. А причина высоких трат часто не в них, а в длинном контексте проекта, объёмных кодовых базах и агентных циклах, которые работают в фоновом режиме, отмечают критики проекта.
- В мае 2026 года разработчик Александр Хусо сказал Business Insider, что это он придумал способ с «пещерным» стилем и рассказал о нём на Reddit. Но «в open source нет такого понятия, как воровство». По его словам, режим всё же портит качество кода Claude Code и подходит только для экспериментов.
- Из-за растущих расходов на токены некоторые компании вводят прямые ограничения для разработчиков. Uber в июне 2026 года ввёл лимит до $1500 в месяц для каждого ИИ-инструмента на одного сотрудника. Coinbase перешла на китайские нейросети. Microsoft, по данным The Verge, обязала инженеров перенести проекты из Claude Code в Microsoft Copilot.