🔗LLM-агенты для управления запасами

Сегодняшний ритейл сталкивается с высокой волатильностью спроса, требующей гибкого подхода к управлению запасами. Традиционные методы, такие как эвристические модели или обучение с подкреплением, требуют длительного обучения и сложных алгоритмов. Они часто недостаточно прозрачно объясняют принятие решений, что затрудняет анализ работы всей цепочки.

InvAgent — это многоагентная LLM система, в которой на каждом этапе цепочки поставок (от производителя до розничного звена) работает отдельный агент. Эти агенты могут адаптивно управлять запасами, учитывая текущие данные и показатели, такие как время выполнения заказа, уровень запасов, спрос и объемы поставок. InvAgent использует возможность zero-shot learning, благодаря чему система может принимать обоснованные решения без предварительного обучения на конкретных примерах.

Пайплайн работы InvAgent
Пайплайн работы InvAgent

Этапы работы подхода:

1. Прокси-пользователь запускает симуляцию, запрашивает данные о текущем состоянии всех агентов.

2. Каждый агент анализирует свое состояние (уровень запасов, невыполненные заказы, прошлые продажи и ожидаемые поставки).

3. Используя метод CoT, агент формулирует свои действия на основе "золотого правила" — открытые заказы должны всегда быть равны "ожидаемым заказам от нижестоящего звена + невыполненным заказам".

4. Агенты обмениваются данными через прокси, что позволяет быстро реагировать на изменения в спросе.

5. Агенты получают обратную связь и переходят к следующему этапу управления запасами.

Для оценки эффективности InvAgent проводились симуляции, в которых анализировались разные сценарии спроса: постоянный, переменный, сезонный и нормальный. В каждом сценарии InvAgent сравнивался с традиционными эвристическими моделями и моделями обучения с подкреплением. InvAgent показал конкурентоспособные результаты, особенно в условиях изменяющегося спроса, при этом демонстрируя простоту внедрения и гибкость. Обогатив подход дополнительными данными, а также применяя более сложные установки "золотого правила" можно улучшать результаты как модели в общем, так и конкретных категорий товаров.

Результаты экспериментов показали, что InvAgent демонстрирует конкурентоспособную производительность, особенно в сценарии переменного спроса. Хотя другие модели обучения с подкреплением, показали лучшие результаты в некоторых других сценариях, InvAgent обладает рядом преимуществ:

  • InvAgent не требует предварительного обучения на конкретных примерах, что упрощает его внедрение и адаптацию к новым ситуациям.
  • Благодаря использованию CoT, InvAgent может обосновывать свои действия, что делает его более прозрачным и надежным.
  • InvAgent не требует сложных процедур обучения, как модели машинного обучения, что делает его более доступным для использования.

Больше ежедневных статей и ссылок на материалы в телеграм-канале:

Начать дискуссию