Тру стори: как ИИ агенты слили $47К

Прекрасная история, как мультиагентная AI система слила $47,000 после запуска в продакшен. И как этого избежать. Учимся на чужих ошибках!

Агента А и B попали в бесконечный цикл, а Агент С отвалился и не смог их выручить. Итог - чек от Амазон на 47К!
Агента А и B попали в бесконечный цикл, а Агент С отвалился и не смог их выручить. Итог - чек от Амазон на 47К!

Дисклеймер: история взята из этой статьи. Очень уж она мне понравилась, захотелось с вами поделиться, ведь тема все насущнее!

Мультиагентные системы — это системы, построенные на взаимодействии нескольких AI агентов. Простая система может строиться даже на двух агентах: Агент А принимает запросы у юзера и формулирует задачу, а Агент Б, например, пишет код и анализирует данные.

Тогда взаимодействие строится так:

Юзер: спросил, какие финансовые результаты квартала

Агент А: понял запрос, наше ссылку на табличку с отчетом и вызвал Агента Б, чтобы тот посчитал основные статистики

Агент Б: взял данные, написал питон код для подсчета всяких средних и тд. Вернул Агенту А.

Агент А: сформировал отчет из полученных статистик — вернул юзеру.

На бумаге волшебно, каждый занят своим делом! А на практике... в компании из статьи два агента застряли в бесконечном лупе:

Агент А: отправил запрос Агенту Б

Агент Б: отправил уточняющий вопрос Агенту А

Агент А: отправил разъяснения и повторный запрос Агенту Б

Агент Б: отправил уточняющий вопрос Агенту А (напоминает того одаренного коллегу, который есть в каждой компании… )

--- Повторять цикл 11 дней ---

*Счет от Амазон на $47К приходит на почту*

Как можно было этого избежать? Вкладываться в инжиниринг!

AI и агенты — самая хайповая, но требущая наименьших усилий и времени часть разработки. 90% всего времени займет все остальное:

1. Четкое ограничение и лимитирование ресурсов, за пределы которых агенты не могут выйти (чтобы не жрали токены и не шафлили базы данных бесконечно)

2. Качественное описание всех доступных данных, тулов и других агентов. MCP тут спасает, но только частично.

3. Оптимизация самих тулов под агентов. Агенты активно пользуются тулами, потому что это их способ добыть информацию, а она им очень нужна! К тому же агентов может быть несколько. Оптмизируйте тулы к бомбардировке запросами, чтобы они не прилегли под нагрузкой.

4. Кеширование одинаковых запросов к агентам. Запросы повторяются чаще, чем кажется.

5. Мониторинг работы агентов. Дашборд с информацией по всем важным для системы метрикам, включая:

  • статус каждого агента
  • логи по каждому агенту
  • задачи в работе и выполненные
  • количество затрачиваемых токенов
  • время на выполнение задачи
  • задержки в общении между агентами и тулами
  • расходы на агентов и тулы, и тд.

6. Поиск аномалий. В мониторинге должны быстро отлавливаться:

  • циклы, в которых застряли агенты
  • исключения, в которых агенты останавливают работу
  • всплески затрат и задержек
  • существующие боттелнеки в пайплайне, и тд.

Не пренебрегайте этими шагами и правильно распределяйте время на этапе разработки, чтобы не попасть на неожиданную сумму в продакшене!

Подписывайтесь на Telegram Заместители. Там еще больше интересного и полезного контента по ИИ агентам.

2
Начать дискуссию