{"id":14268,"url":"\/distributions\/14268\/click?bit=1&hash=1e3309842e8b07895e75261917827295839cd5d4d57d48f0ca524f3f535a7946","title":"\u0420\u0430\u0437\u0440\u0435\u0448\u0430\u0442\u044c \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u0430\u043c \u0438\u0433\u0440\u0430\u0442\u044c \u043d\u0430 \u0440\u0430\u0431\u043e\u0447\u0435\u043c \u043c\u0435\u0441\u0442\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f71e1caf-7964-5525-98be-104bb436cb54"}

Библиотека PyTorch Forecasting как "серебряная пуля" в прогнозировании спроса

В предыдущей статье я писал про применения ML для дистрибьюторов и производителей потребительских товаров при прогнозировании спроса.

Давайте обсудим, как при построении модели спроса максимально упростить жизнь специалисту по данным. А именно поговорим о библиотеке PyTorch Forecasting.

Временные ряды

PyTorch Forecasting это библиотека для работы с временными рядами.

Напомню, что временной ряд - это упорядоченная по времени последовательность показателей.

Простой пример временного ряда - зависимость продаж от сезонов или от дней недели. Зимой лучше продаются валенки, а летом - купальники. По будням больше покупают в деловом центре города, а по выходным - в спальных районах.

Что это означает с точки зрения работы с данными? Рассмотрим на примере обучающей и тестовой выборки. Когда мы берем не зависящий от времени набор данных, то можно случайным образом взять фрагменты данных и использовать как тестовые. А при работе с временными рядами так делать неправильно. Потому что если для прогнозирования продаж валенок в феврале взять данные за май - июль, то можно случайно обогатить производителей угги, например.

Преимущества библиотеки PyTorch Forecasting

Библиотека PyTorch Forecasting позволяет решить задачу прогнозирования спроса даже не сильно опытному специалисту по данным. Ее суть в большом количестве предобработки. Получив указание, какими данными воспользоваться, она их сама масштабирует. Кроме того она оценивает, какой из большого количества факторов влияет на результат. Она укажет, если при изменении какого-то фактора сильно возрастает ошибка.

Для задач прогнозирования спроса отдельно можно выделить следующие особенности:

  • исследует несколько временных рядов одновременно. Это актуально, например, если у нас есть данные по продажам конкурентов за схожие периоды
  • автокорреляция, т.е. исследует, как ряд вел себя в прошлом, чтобы спрогнозировать, как будет вести себя в будущем.
  • учитывает внешние факторы, такие как курс доллара, евро, погоду и т.д.
  • учитывает эффекты каннибализации
  • делает перцентильный прогноз, т.е. дает наихудшую и наилучшую оценку прогноза

С учетом перечисленного сегодня с помощью PyTorch Forecasting собираются большинство решений для крупного бизнеса в России и СНГ.

Вместо вывода

В предыдущей статье мы обсудили, что можно сделать с помощью ML, а в этой - как. Существуют и другие библиотеки, о которых в другой раз. Но PyTorch Forecasting - отличный инструмент. Специалисту по данным обязательно надо иметь его ввиду при построении моделей спроса.

0
Комментарии
-3 комментариев
Раскрывать всегда