Большие данные по малому бизнесу
Что может рассказать Telegram-бот Эвотора о российском малом бизнесе?
Полина Величкина, ведущий аккаунт-менеджер по развитию рекламных продуктов и монетизации данных ИТ-компании «Эвотор», рассказывает о новом инструменте аналитики малого бизнеса ― Telegram-боте “Эвобот”. Как Эвобот использует big data Эвотора и ML-технологии и почему он знает, как вы продавали прошлым летом?
Что расскажет Эвобот?
Мы, в Эвоторе, запустили новый инструмент аналитики малого бизнеса ― Telegram бот ― @evomoneybot. Бот использует обезличенные данные продаж наших смарт-терминалов «Эвотор» и дает информацию о ключевых показателях разных сегментов МСБ.
По каждому сегменту можно узнать данные по 15 ключевым параметрам. Среди них: средний чек, среднее число позиций в чеке, среднее количество чеков в день для одной точки, число чеков по времени суток и дням недели. Можно также узнать средние показатели самых эффективных и самых слабых точек.
Данные представлены по 125 отраслям, например, магазины автотоваров, хозяйственные магазины, обувные магазины, салоны красоты и др. Это оффлайн бизнес, сегмент который наименее "оцифрован" в плане доступной публичной статистики, в отличие от екома. По умолчанию Эвобот дает общероссийские показатели, но можно получить и информацию по макрорегиону: Центр, Северо-Запад, Урал и т.п. Данные разбиты помесячно за последние 12 месяцев.
Например, вот статистика цветочным магазинам за март, по данным Эвобота:
- Средний чек магазинов цветов в марте составил 1943 рубля.
- В среднем один магазин пробивал 15 чеков в день, среднее количество позиций в чеке ― 1,2.
- Самые эффективные точки продавали в среднем 34 букета, а их средний чек достигал 2904 рубля. Самые неэффективные точки в день били только 3 чека, а их средний чек был только 1231 рубль.
- Активнее всего продажи идут с 12:00 до 17:59 ― в этот промежуток времени пробивалось 8,4 чека, ночью, с 00:00 до 5:59, среднее число чеков составило 3,7.
- В марте самый “горячий”, с наибольшим числом чеков, день недели ― это вторник (что очевидно связано с тем, что 8 марта выпал на вторник). Самый “мертвый” день недели в феврале ― воскресенье.
- Среднее количество онлайн-касс на организацию ― 1,3, а максимальное ― 5.
Анализируй это. Для кого Эвобот?
В первую очередь, конечно, для предпринимателей. В личном кабинете Эвотора мы даем ключевые показатели по бизнесу владельца смарт-терминала: его выручку, средний чек, количество чеков и позиций в одном чеке, популярные товары, скидки, возвраты. C Эвоботом предприниматели могут сравнить свои результаты со средними в своем сегменте. Именно поэтому мы ввели сравнение с лучшими и худшими точками. По Эвоботу можно отследить сезонные всплески спроса, динамику, спрогнозировать продажи и скорректировать закупки.
Эвобот пригодится, если нужно оценить новую нишу на старте проекта, потенциальную выручку и продажи. Тем не менее мы не хотим ограничиваться только бизнесом. Эвобот также может быть полезен для аналитиков рынка при проведении исследований и для СМИ. Фактически, каких-либо других публичных и бесплатных данных по сегментам МСБ сейчас просто нет.
Big data ― важное направление для Эвотора. Мы продаем большие данные и мы делимся ими бесплатно. В разумных пределах, конечно. На сегодня у нас зарегистрировано 850 тысяч онлайн-касс “Эвотор”, через них ежедневно проходят около 10 миллиона чеков. Это огромный пласт данных.
Мы стали проводить различные исследования с 2019 года, накопив достаточную базу касс по стране. Делаем коммерческие исследования по продажам определенных категорий или товаров по заказу производителей/дистрибьюторов, а также некоммерческие исследования для СМИ.
В 2020 году, во время пандемии, наши данные стали своеобразным барометром состояния малого бизнеса. Мы чуть ли не еженедельно следили за тем, какой процент точек МСБ работает и насколько упала выручка из-за локдауна.
В 2021 году мы запустили Индексы Эвотора. Они показывают усредненное изменение цен в ключевых категориях товаров в торговых точках традиционной розничной торговли. Для расчета мы взяли наиболее популярные товары, которые широко представлены в большинстве регионов. Мы начали с Индекса по продуктам, позже добавили непродовольственные товары повседневного спроса, алкоголь, сигареты и лекарства. Сейчас мы смотрим цены на 523 товарных наименования (SKU) из 71 категории.
Как мы делали Эвобота?
Идея создания Telegram бота пришла во время обсуждения актуальных маркетинговых инструментов. Telegram боты удобны и популярны, широко используются в разных сферах бизнеса, и хороши всем, разве что посуду не помоют.
Начали работу над ботом в ноябре прошлого года. Архитектуру бота создавали вместе с агентством MOAB.
Для определения ключевых параметров взяли бизнес-показатели из личного кабинета. После опроса предпринимателей из разных отраслей добавили данные по лучшим и худшим точкам, разбивку по наибольшему числу чеков в зависимости от времени суток, по лучшим и худшим дням недели.
В центре анализа ― наша собственная модель машинного обучения, которая определяет сегмент точки в зависимости от позиций в чеке. Она “прочесывает” все чеки на смарт-терминале, сравнивает их с обучающей выборкой и выбирает наиболее релевантный сегмент с определенной вероятностью. Сама модель достаточно простая, она не настроена делать какие-либо прогнозы, но достаточно эффективная.
Для бота модель просматривает продажи на всех терминалах за месяц. Затем мы делаем дополнительные очистки по регионам и из полученных данных выбираем только те сегменты, точность определения (probability) которых больше 90%.
Есть сегменты, где возможна путаница и очень важны “отсечки”. К примеру, пересечение ассортимента может быть у детских магазинов и магазинов канцтоваров, у кафе и продуктовых магазинов, у салонов красоты и спа-салонов или барбершопов. Как в известной шутке о big data: "В этом году вы были в нашем супермаркете 156 раз, и ваш любимый товар — пакет". Если наша ML-модель “сомневается”, она определяет сегмент с более низкой долей точности, и мы отбрасываем их из выборки.
Так как сегментация Эвотора достаточно подробная ― более 100 категорий, мы укрупнили сегменты для удобства навигации. Те же магазины цветов попали в подборку “Все для праздников” вместе с магазинами открыток, подарков и сувениров.
Мы также делаем дополнительную проверку по времени чека ― сравниваем разницу между временем кассы и серверным временем. Пользователи могут случайно сменить настройки кассы и “сбить” время. Если есть разница, то мы этому времени не доверяем и отбрасываем эти чеки. По среднему количеству чеков для каждого времени суток мы каждую дату жестко делим на периоды по 6 часов и чеки округляем внутри до часа, так чтобы они не пересекались и не потерялись. И уже дальше делаем необходимые расчеты по параметрам для бота.
Для Эвобота мы делаем достаточно жесткую выборку: точность определения сегмента не ниже 90%, верно указан регион и время кассы. В результате в некоторых узких сегментах может не хватать данных для качественного анализа. Мы решили предупреждать об этом пользователей с помощью цвета: зеленый ― данных достаточно, желтых ― данных может быть недостаточно, красный ― данных совсем мало.
Мы бы хотели делать данные с точностью до субъекта РФ, но пока остановились на макрорегионах ― округах. Возможно, с улучшением качества данных мы сделаем аналитику вглубь.
В Эвоботе мы также даем ссылку на наши информационные ресурсы о малом бизнесе: на Telegram канал «Зеленая кнопка» и онлайн-журнал Жиза. К примеру, для тех, кто выгружал данные по цветочным магазинам, бот предложит материал о предпринимательнице, которая открыла магазин цветов. В перспективе к нему можно “прикручивать” и другие полезные “фишки”.
Телеграм-бот пока запущен в бета-версии. Мы хотим его развивать, улучшать данные и открыты для предложений по его совершенствованию и доработке.