Проверили счета компаний за AI на 34 миллиона долларов и нашли 1,7 миллиона лишнего.
Как наткнулся. Стартап-аудитор Vaudit прошёлся по инвойсам 60 компаний за март-июнь (среди клиентов Panasonic, HP, Honda), большинство счетов это Claude Code. Часть переплат банальная: биллили по дорогой новой модели, хотя по факту работала дешёвая старая. Но самое любопытное другое.
Retry storm. Агент берёт задачу, падает, перезапускает её в фоне, падает снова, и так по кругу. Каждая попытка идёт в счёт. То есть вы платите не за результат, а за повторные заходы, которые ничем не закончились. Тихо набегает, пока кто-то не откроет логи.
А как они вообще доказали, что это переплата. Тут механика простая и до скучного бухгалтерская. Vaudit ставит свой SDK внутрь вашей AI-среды, и тот пишет сырое использование на вашей стороне: какая модель реально вызвана, сколько токенов, завершился запрос или вернул ошибку. Дальше сверяет это со счётом провайдера. Расхождение и есть переплата. Свой счётчик правды против чужого счёта, классическая реконсиляция, просто перенесённая на токены. Отсюда и три класса находок: модель в счёте не та, что в логах; оплачены упавшие запросы; и серия фоновых повторов одной задачи.
Справедливости ради: Anthropic с частью претензий спорит (говорят, не берут денег за упавшие запросы и не подменяют модель), а провайдеры около 80% спорных сумм уже вернули. Так что это не «скандал», а скорее «проверяйте».
Что с этим делать. Счёт за работу агента надо читать так же, как вы бы проверили работу подрядчика. Три проверки за десять минут:
- Модель в счёте это та же модель, что в логах? Не платите ли за дорогую вместо дешёвой.
- Есть ли начисления за запросы, которые вернули ошибку или не завершились.
- Всплески одинаковых повторных вызовов это и есть retry storm. Один упавший агент, который молотит в фоне.
Мысль простая: автономный агент удобен ровно до того момента, пока вы не посчитали, сколько он сжёг на попытках, которые ничем не закончились.
А вы свои AI-счета за последний месяц вообще открывали? Что там по повторным запросам?