Большие данные по малому бизнесу

Что может рассказать Telegram-бот Эвотора о российском малом бизнесе?

Полина Величкина, ведущий аккаунт-менеджер по развитию рекламных продуктов и монетизации данных ИТ-компании «Эвотор», рассказывает о новом инструменте аналитики малого бизнеса ― Telegram-боте “Эвобот”. Как Эвобот использует big data Эвотора и ML-технологии и почему он знает, как вы продавали прошлым летом?

Что расскажет Эвобот?

Мы, в Эвоторе, запустили новый инструмент аналитики малого бизнеса ― Telegram бот ― @evomoneybot. Бот использует обезличенные данные продаж наших смарт-терминалов «Эвотор» и дает информацию о ключевых показателях разных сегментов МСБ.

По каждому сегменту можно узнать данные по 15 ключевым параметрам. Среди них: средний чек, среднее число позиций в чеке, среднее количество чеков в день для одной точки, число чеков по времени суток и дням недели. Можно также узнать средние показатели самых эффективных и самых слабых точек.

Эвобот в действии
Эвобот в действии

Данные представлены по 125 отраслям, например, магазины автотоваров, хозяйственные магазины, обувные магазины, салоны красоты и др. Это оффлайн бизнес, сегмент который наименее "оцифрован" в плане доступной публичной статистики, в отличие от екома. По умолчанию Эвобот дает общероссийские показатели, но можно получить и информацию по макрорегиону: Центр, Северо-Запад, Урал и т.п. Данные разбиты помесячно за последние 12 месяцев.

Например, вот статистика цветочным магазинам за март, по данным Эвобота:

  • Средний чек магазинов цветов в марте составил 1943 рубля.
  • В среднем один магазин пробивал 15 чеков в день, среднее количество позиций в чеке ― 1,2.
  • Самые эффективные точки продавали в среднем 34 букета, а их средний чек достигал 2904 рубля. Самые неэффективные точки в день били только 3 чека, а их средний чек был только 1231 рубль.
  • Активнее всего продажи идут с 12:00 до 17:59 ― в этот промежуток времени пробивалось 8,4 чека, ночью, с 00:00 до 5:59, среднее число чеков составило 3,7.
  • В марте самый “горячий”, с наибольшим числом чеков, день недели ― это вторник (что очевидно связано с тем, что 8 марта выпал на вторник). Самый “мертвый” день недели в феврале ― воскресенье.
  • Среднее количество онлайн-касс на организацию ― 1,3, а максимальное ― 5.

Анализируй это. Для кого Эвобот?

В первую очередь, конечно, для предпринимателей. В личном кабинете Эвотора мы даем ключевые показатели по бизнесу владельца смарт-терминала: его выручку, средний чек, количество чеков и позиций в одном чеке, популярные товары, скидки, возвраты. C Эвоботом предприниматели могут сравнить свои результаты со средними в своем сегменте. Именно поэтому мы ввели сравнение с лучшими и худшими точками. По Эвоботу можно отследить сезонные всплески спроса, динамику, спрогнозировать продажи и скорректировать закупки.

Личный кабинет Эвотора 
Личный кабинет Эвотора 

Эвобот пригодится, если нужно оценить новую нишу на старте проекта, потенциальную выручку и продажи. Тем не менее мы не хотим ограничиваться только бизнесом. Эвобот также может быть полезен для аналитиков рынка при проведении исследований и для СМИ. Фактически, каких-либо других публичных и бесплатных данных по сегментам МСБ сейчас просто нет.

Big data ― важное направление для Эвотора. Мы продаем большие данные и мы делимся ими бесплатно. В разумных пределах, конечно. На сегодня у нас зарегистрировано 850 тысяч онлайн-касс “Эвотор”, через них ежедневно проходят около 10 миллиона чеков. Это огромный пласт данных.

Мы стали проводить различные исследования с 2019 года, накопив достаточную базу касс по стране. Делаем коммерческие исследования по продажам определенных категорий или товаров по заказу производителей/дистрибьюторов, а также некоммерческие исследования для СМИ.

В 2020 году, во время пандемии, наши данные стали своеобразным барометром состояния малого бизнеса. Мы чуть ли не еженедельно следили за тем, какой процент точек МСБ работает и насколько упала выручка из-за локдауна.

В 2021 году мы запустили Индексы Эвотора. Они показывают усредненное изменение цен в ключевых категориях товаров в торговых точках традиционной розничной торговли. Для расчета мы взяли наиболее популярные товары, которые широко представлены в большинстве регионов. Мы начали с Индекса по продуктам, позже добавили непродовольственные товары повседневного спроса, алкоголь, сигареты и лекарства. Сейчас мы смотрим цены на 523 товарных наименования (SKU) из 71 категории.

Как мы делали Эвобота?

Идея создания Telegram бота пришла во время обсуждения актуальных маркетинговых инструментов. Telegram боты удобны и популярны, широко используются в разных сферах бизнеса, и хороши всем, разве что посуду не помоют.

Начали работу над ботом в ноябре прошлого года. Архитектуру бота создавали вместе с агентством MOAB.

Для определения ключевых параметров взяли бизнес-показатели из личного кабинета. После опроса предпринимателей из разных отраслей добавили данные по лучшим и худшим точкам, разбивку по наибольшему числу чеков в зависимости от времени суток, по лучшим и худшим дням недели.

В центре анализа ― наша собственная модель машинного обучения, которая определяет сегмент точки в зависимости от позиций в чеке. Она “прочесывает” все чеки на смарт-терминале, сравнивает их с обучающей выборкой и выбирает наиболее релевантный сегмент с определенной вероятностью. Сама модель достаточно простая, она не настроена делать какие-либо прогнозы, но достаточно эффективная.

Для бота модель просматривает продажи на всех терминалах за месяц. Затем мы делаем дополнительные очистки по регионам и из полученных данных выбираем только те сегменты, точность определения (probability) которых больше 90%.

Есть сегменты, где возможна путаница и очень важны “отсечки”. К примеру, пересечение ассортимента может быть у детских магазинов и магазинов канцтоваров, у кафе и продуктовых магазинов, у салонов красоты и спа-салонов или барбершопов. Как в известной шутке о big data: "В этом году вы были в нашем супермаркете 156 раз, и ваш любимый товар — пакет". Если наша ML-модель “сомневается”, она определяет сегмент с более низкой долей точности, и мы отбрасываем их из выборки.

Не всегда по данным чеков можно четко разделить продуктовую лавку от небольшой точки общепита
Не всегда по данным чеков можно четко разделить продуктовую лавку от небольшой точки общепита

Так как сегментация Эвотора достаточно подробная ― более 100 категорий, мы укрупнили сегменты для удобства навигации. Те же магазины цветов попали в подборку “Все для праздников” вместе с магазинами открыток, подарков и сувениров.

Мы также делаем дополнительную проверку по времени чека ― сравниваем разницу между временем кассы и серверным временем. Пользователи могут случайно сменить настройки кассы и “сбить” время. Если есть разница, то мы этому времени не доверяем и отбрасываем эти чеки. По среднему количеству чеков для каждого времени суток мы каждую дату жестко делим на периоды по 6 часов и чеки округляем внутри до часа, так чтобы они не пересекались и не потерялись. И уже дальше делаем необходимые расчеты по параметрам для бота.

Для Эвобота мы делаем достаточно жесткую выборку: точность определения сегмента не ниже 90%, верно указан регион и время кассы. В результате в некоторых узких сегментах может не хватать данных для качественного анализа. Мы решили предупреждать об этом пользователей с помощью цвета: зеленый ― данных достаточно, желтых ― данных может быть недостаточно, красный ― данных совсем мало.

Мы бы хотели делать данные с точностью до субъекта РФ, но пока остановились на макрорегионах ― округах. Возможно, с улучшением качества данных мы сделаем аналитику вглубь.

В Эвоботе мы также даем ссылку на наши информационные ресурсы о малом бизнесе: на Telegram канал «Зеленая кнопка» и онлайн-журнал Жиза. К примеру, для тех, кто выгружал данные по цветочным магазинам, бот предложит материал о предпринимательнице, которая открыла магазин цветов. В перспективе к нему можно “прикручивать” и другие полезные “фишки”.

Телеграм-бот пока запущен в бета-версии. Мы хотим его развивать, улучшать данные и открыты для предложений по его совершенствованию и доработке.

88
Начать дискуссию