Задача была ясна – разработать решение, которое позволит увеличить эффективность прохода контролеров, а именно, за смену встретить наибольшее количество безбилетников. Для ее решения нам нужно было собрать исторические данные о транзакциях (оплатах), маршрутах контролеров, GPS транспорта и расписании.
Комментарий недоступен
Спасибо большое за комментарий! Да, вы правы, такая цель тоже имеет место быть) правильно распоряжаться человеческими ресурсами очень важно
а то, что вполне очевидно, где больше зайцев — не спорим с этим, так и есть, это просто важно учесть в создании модели, как и остальные данные!
"Что внутри сервиса: комбинированный подход
Полученный алгоритм представляет собой комплексное решение: в нем использовались модели как Machine Learning, так и Operations Research. С помощью ML предсказываются количество безбилетников в конкретный момент времени в конкретном маршруте, а c OR – оптимизируется суммарный проход всех контролеров с учетом указанной выше целевой функции. Модели представляют собой веб-сервис с доступом по API."
а можно какие-то детали?
вообще решение выглядит как некоторый анализ изменения функций построенных на пассажирских потоках
Верно, только не только пассажиропоток, но и транзакции оплат.
Первая модель регрессии обучается на этих исторических данных и потом прогнозирует на каждый момент времени на каждый участок маршрута, сколько будет безбилетников. Затем эти предсказания накладываются на динамический граф, где, грубо говоря, вершина — это участок маршрута и время, а ребро — это переход между разными вершинами контролером, выраженный временем и расстоянием. Вторая модель, используя данный граф, обходит его и подбирает для n контролеров n маршрутов так, чтобы максимизировать количество увиденных зайцев за смену.