Почему «дешевый» ИИ-агент на самом деле стоит как отдел сотрудников?
Самая большая ошибка при запуске ИИ-агента — считать его стоимость по токенам. Это все равно что оценивать стоимость автомобиля по цене бензина, который он сжигает. Но правда в другом: токены дешёвые, ошибки — нет. В ИИ-проектах любят обсуждать именно стоимость токенов, потому что это безопасно. Обсуждать стоимость ошибок уже страшнее. А именно они и съедают бюджет.
Иллюзия дешёвого продакшена
На демо всё выглядит красиво: агент шустро отвечает, анализирует, пишет отчёты, формирует решения. Стоимость запроса — копейки. И кажется, что масштабирование — это просто вопрос наращивания объёма. Но затем начинается продакшен.
И тут вдруг оказывается, что агент:
· иногда неверно интерпретирует вход;
· иногда «уверенно» делает неправильный вывод;
· иногда пропускает важный сигнал;
· иногда инициирует лишнее действие.
И не потому, что модель плохая, а потому что модель – это вероятностная система. LLM не знает, она выбирает наиболее вероятный вариант ответа. И именно здесь начинается настоящая экономика.
Кейс, который никто не любит обсуждать
Представим компанию, которая запускает ИИ-агента для обработки входящих обращений клиентов. Примерная нагрузка – около 10 000 запросов в день. Агент ошибается всего в 1% случаев. Звучит отлично. Но 1% — это уже 100 ошибок ежедневно. Если средняя стоимость инцидента — 1500 ₽, то в день это 150 000 ₽. И если на разбор каждой ошибки уходит 5 минут — это больше 8 часов работы в день. Фактически — отдельный сотрудник только на контроль качества ответов агента. И токены до сих пор стоят недорого. Дорогой становится неопределенность.
Почему токены — это 10% расходов
Прямая стоимость ИИ-агента складывается из:
· стоимости токенов API;
· стоимости владения или пользования сервером;
· стоимости интеграции.
На бумаге выглядит разумно. Но реальный продакшен требует:
· аудита действий;
· логирования;
· контроля полномочий;
· тестовых наборов и их регулярных прогонов;
· мониторинга деградации;
· fallback-сценарии;
· ручной верификации спорных случаев.
И это не «перестраховка», это цена управляемости. Без этой инфраструктуры агент дешёвый, но непредсказуемый. С ней он становится управляемой системой. И именно эта часть обычно стоит дороже самой модели.
Почему 99% точности — это плохая новость?
В AI-проектах любят говорить: «У нас 99% точности нашего агента». Но 1% ошибки в системе, которая делает 50 000 операций в месяц — это целых 500 проблем. Получается, главный вопрос не в процентах, а в масштабе. ИИ не ломается как обычный софт, он систематически отклоняется в пределах статистической вероятности самой модели. И если архитектура не учитывает это, бизнес платит за последствия неопределенности.
Чем больше автономности — тем дороже агент
Две сущности одного агента: агент, который советует, и агент, который действует. Субъект один, финансовые модели и последствия разные. Если система может менять данные, инициировать транзакции или сама запускать процессы, то каждое вероятностное отклонение становится операционным риском. Автономность почти всегда увеличивает бюджет, потому что увеличивает цену самой ошибки.
Многие в проектах считают так: «Раз API стоит недорого, значит, и агент будет недорогой в эксплуатации». А через месяц выясняется, что нужно ограничивать полномочия агента, строить систему мониторинга, вводить ручные гейты и формировать контур ответственности. И бюджет в лучшем случае удваивается, не потому что ИИ дорогой, а потому что изначально не посчитали неопределённость.
Правильный вопрос
Когда вы запускаете ИИ-агента, спросите себя:
· сколько стоит ошибка этой системы?
· кто оплачивает последствия?
Если в бюджете проекта нет отдельной строки «Управление неопределённостью», значит, вы просто ещё не увидели её реальную цену. ИИ - не магия, это вероятностный механизм, который может быть выгодным, но только в том случае, если неопределённость самой модели учтена заранее. В противном случае вы не экономите на токенах, вы авансируете будущие потери бизнеса.
В следующем материале разберу, почему «дешёвый MVP на ИИ» почти всегда превращается в дорогой продакшен.