«Разница в 10 копеек на мандарины может стоить супермаркету миллионы»: как рассчитать оптимальную цену с помощью ИИ

Как разработать платформу ценообразования, которая анализирует тысячи факторов и увеличивает выручку ритейлеров до 7% — рассказывает Сергей Воробьёв, CEO и сооснователь KeepRise.

«Разница в 10 копеек на мандарины может стоить супермаркету миллионы»: как рассчитать оптимальную цену с помощью ИИ

KeepRise — технологический стартап, который основали бывшие сотрудники крупного российского интегратора «КОРУС Консалтинг». Команда помогает розничным и оптовым клиентам, торговым сетям и производствам повышать выручку, маржинальность и товарооборот. Основная услуга компании — автоматизация ценообразования.

Сергей Воробьёв
CEO и сооснователь KeepRise

Я уже 15 лет занимаюсь ценообразованием. В 2018 году в «КОРУС Консалтинге» мы с командой создали направление по автоматизации этого процесса в розничных компаниях. За три года реализовали пять больших проектов, каждый из которых повысил прибыль клиентов от 2 до 5%.

В 2022 году спрос на системы интеллектуального ценообразования в России резко вырос, а у нашей команды к тому времени уже был большой опыт в этой сфере. Появились идеи, которые ещё не были реализованы в похожих системах, поэтому мы решили разработать свой продукт.

Мы сознательно пропустили этап создания MVP (Minimum Viable Product — минимально жизнеспособный продукт), когда команда выпускает систему с ограниченным набором функциональностей, но достаточным для того, чтобы начать использовать продукт. Решили создать решение в партнёрстве с клиентом, компанией билайн, и сразу выпустить его на рынок. Идея оказалась успешной благодаря грамотно распределённым ролям, привлечению дополнительных разработчиков, дата-аналитиков и дата-сайентистов, а также эффективной организации производства..

К марту — апрелю 2023 года мы уже предоставляли готовую систему. На тот момент у нас было два постоянных клиента, включая билайн. Компания до сих пор использует наш сервис для формирования цен во всех каналах продаж, включая офлайн-магазины.

Как «думает» система KeepRise

Для определения оптимальной цены на товар или услугу компаниям необходимо обрабатывать огромный массив данных — до 150 тысяч факторов. На что нужно обратить внимание:

  • на рынок поставщиков: изучать тренды, понимать регулярность выпуска новых товаров и подходы к этому процессу, а также динамику изменения стоимости сырья;
  • на действия государства: фиксировать изменения законодательства в области ценообразования, знать границы цен, которые компании не должны превышать;
  • на рынок в целом: мониторить действия конкурентов и партнёров, оценивать эффективность их маркетинговых кампаний.

Чтобы упростить клиентам поиск оптимальной цены, мы решили разработать ML-модель, которая рассчитает спрос и на основе тысячи факторов спрогнозирует, как изменение цены на 1% повлияет на продажи.

Вот классическая кривая спроса «из учебника», которая работает по принципу: выше цена — ниже спрос, и наоборот. Отрицательный наклон говорит о желании покупателей приобрести большее количество товаров при меньшей цене.

Точки пересечения 1 и 2 показывают, как стоимость товара влияет на спрос  
Точки пересечения 1 и 2 показывают, как стоимость товара влияет на спрос  

Каждый товар по-разному реагирует на изменение цен. Наша система с помощью искусственного интеллекта (ИИ) исследует конкретный закон спроса для каждого артикула.

Подход можно схематично отобразить в виде дуги: заниженная или завышенная цена не позволят заработать, но есть точка — та самая оптимальная цена, которую мы ищем с помощью обработки транзакционных данных (история продаж и закупок, вид платежей и другие показатели). Оптимальной она считается потому, что удовлетворяет обоим условиям: максимальная прибыль при отсутствии снижения спроса.

Дуга зависимости прибыли от цен. Точка пересечения функций — это и есть оптимальная цена на товар 
Дуга зависимости прибыли от цен. Точка пересечения функций — это и есть оптимальная цена на товар 

Мы выбрали алгоритм к поиску оптимальной цены, который называется сэмплирование Томпсона. Его используют многие компании по всему миру, в частности американский ритейлер Walmart и российский сайт объявлений «Авито».

Проще всего объяснить сэмплирование Томпсона через аналогию с роботом-пылесосом: сначала он бьётся о стены, двери и стулья, но после нескольких уборок перестаёт ошибаться. Это обучение с подкреплением, когда в качестве окружения выступает обстановка квартиры. Для ценообразования окружение — реакция рынка на изменения цен. Позитивная реакция выражается в приросте выручки, негативная — в падении. Если прослеживать аналогию, в случае с пылесосом результатом становится карта квартиры и путешествие робота по ней без столкновений, в случае с ценой — оптимальное соотношение между ценой и спросом, а также отсутствие падения спроса.

При таком подходе система постоянно дообучается на множестве параметров, например сезонности товаров или курсе валют, а также учитывает влияние любых локальных и глобальных экономических событий. Это позволяет сохранять стабильность работы системы даже в периоды кризиса и падения спроса.

Ещё при работе над интеграционными проектами в «КОРУС Консалтинге» мы изучили около 40 российских и зарубежных решений. Почти во всех продуктах есть так называемый вендор-лок — привязка к поставщику.

При модели вендор-лока клиенты должны устанавливать цены строго по принципам поставщика, то есть использовать конкретный набор логик ценообразования.

Мы же хотели создать систему без ограничений в подходах к ценообразованию и заложили в продукт максимальные возможности кастомизации: клиент может полностью настроить алгоритм, учитывая особенности своего бизнеса.

Для того, чтобы обеспечить такую гибкость, нужна сложная архитектура. Поэтому мы начали искать инфраструктуру, которая обеспечит быстрый запуск продукта и предоставит нужные инструменты, ещё и при ограниченном бюджете.

Как Yandex Cloud помог быстро запуститься и что мы делаем в облаке

Мы рассматривали разные типы инфраструктуры — как полностью расположенную в облаке или на физических серверах клиента, так и гибридную. Выбрали гибридную модель: так мы получаем масштабируемые облачные ресурсы для вычислений и поддержку в управлении и обслуживании сервисов за счёт managed-решений, а часть информации храним на собственных серверах.

При поиске облачной платформы мы обращали внимание на разнообразие сервисов и технологий, возможность получить поддержку на развитие стартапа и подход к сотрудничеству в целом. Yandex Cloud устроил нас по этим требованиям, в частности мы получили расширенный грант — 400 тысяч рублей на полгода — как участники программы Yandex Cloud Boost.

Ценообразование связано с постоянным изменением оптимальной цены, поэтому у нас высокие требования к производительности и скорости расчёта. Каждый день для крупных клиентов нам нужно обрабатывать 3–5 ГБ данных.

За неделю мы развернули инфраструктуру в Yandex Cloud. ML-модели разрабатывали в Yandex DataSphere. Для расчёта цены собираем исторические данные минимум за 6 месяцев, максимум — за 3 года. Под историческими данными мы понимаем:

  • информацию о транзакциях — продажи и остатки;
  • вспомогательные данные — программы мотивации персонала и кредитования, истории ретро-бонусов, другую информацию о поставщиках;
  • справочники товаров;
  • информацию о магазинах;
  • косвенную информацию, например о ценах конкурентов.

Эти данные ежедневно поступают в холодное хранилище Yandex Object Storage, предназначенное для редко используемых объектов. Здесь же хранятся архивы, аналитические данные, файлы фронтенда приложения и состояния инфраструктуры. Для вычисления актуальной цены система обращается в холодное хранилище, достаёт из него нужные значения и направляет в горячее хранилище Yandex Managed Service for PostgreSQL. В нём хранятся данных, которые часто используются и должны быть доступны с минимальной задержкой. Они анализируются, и в результате формируется оптимальная цена. Ещё для обработки данных используем сервис Managed Service for ClickHouse®, который помогает разворачивать и поддерживать кластеры серверов ClickHouse® и ускоряет выдачу результата. Параметры приложения храним в Managed Service for MongoDB.

Наша основная задача — готовить данные для обучения ML-моделей. Модели тестируем в DataShpere на тех же вводных данных: транзакциях клиентов за два года. Кластер Kubernetes® используем для управления и масштабирования контейнезированных приложений — на них и построен продукт KeepRise. Технология контейнеризации позволяет запускать приложения автономно от основной операционной системы, так что изменения в одном сервисе не влияют на весь продукт.

Кто разрабатывает систему

В нашей ML-команде четыре человека:

  • основной разработчик занимается RnD-исследованиями, создаёт новые продукты, разрабатывает основные модели;
  • джун помогает разработчику;
  • два дата-аналитика помогают с обработкой и анализом данных.

Сейчас мы ищем двух дата-сайентистов. При решении задач ценообразования их много не бывает, ведь нужна максимальная точность в расчётах.

По нашему опыту, ошибка в определении оптимальной цены на мандарины в 10 копеек может стоить сети супермаркетов нескольких десятков миллионов рублей. Для потребителей даже экономия 10 копеек на конкретный товар может быть фактором в пользу покупки в той или иной сети. Это работает и в обратную сторону: если снизить цену на 10 копеек, это приведёт к значительным потерям в прибыли.

Таким небольшим составом мы построили автоматизированную систему динамического ценообразования, которая ежедневно рассчитывает для клиентов десятки тысяч оптимальных цен на товары. В среднем процесс занимает до 4,5 часа, а стоимость услуги зависит от требований компании, в частности от скорости обработки запроса. По данным наших клиентов, решение KeepRise может увеличить выручку магазинов до 7%, а прибыль — от 2%.

А так выглядит интерфейс системы:

На панели запуска расчётов можно рассмотреть, как обстоят дела у линейки товаров, сравнить с ценами конкурентов и выборочно запустить пересчёт 
На панели запуска расчётов можно рассмотреть, как обстоят дела у линейки товаров, сравнить с ценами конкурентов и выборочно запустить пересчёт 
Панель настройки ценовой архитектуры позволяет устанавливать разные параметры ценообразования для различных групп объектов. Если компания торгует в Москве по одной цене, а во Владивостоке по другой, настройки можно отрегулировать
Панель настройки ценовой архитектуры позволяет устанавливать разные параметры ценообразования для различных групп объектов. Если компания торгует в Москве по одной цене, а во Владивостоке по другой, настройки можно отрегулировать

Как планируем развиваться

Мы работаем с производствами и компаниями из розничной и оптовой торговли.

Наше внутреннее исследование рынка показало, что продукт можно предложить более чем 1500 производствам и 5000 ритейлерам. Мы хотим занять 20% рынка к 2025 году, то есть выстроить сотрудничество более чем с 1000 компаниями.

В этом году мы фокусируемся на создании классического SaaS-продукта, который ориентирован не на enterprise-клиентов, а на средний бизнес. Наша вторая цель на год — изучить возможности генеративных нейросетей. В частности, проверяем, можно ли управлять ценообразованием через LLM-модели — например, чтобы на текстовый запрос «как сделать ценообразование более конкурентным и доходным?» пользователь получал развёрнутый ответ прямо в системе.

Мы хотим, чтобы клиенты могли нажать на кнопку в интерфейсе и посчитать цены без нашей помощи. Для этого нужно корректно пройти все этапы проекта, в частности провести интеграцию, выбрать канал передачи данных, сформировать логику ценообразования и конечный прайс-лист. После этого компания может пользоваться системой автономно. И у нас уже есть клиенты, которые так и работают.

Подписывайтесь на Телеграм-канал Yandex Cloud, чтобы узнавать ещё больше новостей и историй о команде.

Другие истории наших партнёров и клиентов, которые активно читают наши подписчики:

22
22
2 комментария

Интересная статья, но есть слабый момент — не до конца раскрыто, как динамическое ценообразование повлияет на нагрузку сотрудников магазинов. Увеличение объёма данных и постоянные корректировки цен могут усложнить их работу и потребовать больше времени на адаптацию.

Спасибо за вопрос, уточнили у наших коллег из KeepRise.
Вы верно подметили, что возможности повышения скорости переоценок нередко ведут к подобному конфликту. Это бизнес-ограничение снимается двумя способами: 1) Приоритизация переоценки. Ресурса специалистов не всегда достаточно, поэтому важно обговаривать с участниками проекта их возможности. 2) Установка электронных ценников. Это довольно дорогостоящий проект для ритейла, но в случаях кадрового голода крупные компании прибегают и к этому решению. KeepRise не предоставляет такие услуги, но способствует развитию этих технологий и ускоряет темпы их окупаемости.
Несмотря на то, что на первый взгляд может показаться, что путь приоритизации обрамляет систему и не дает ей раскрыться в полной мере, это не совсем так. Извлекать значительную выгоду вполне возможно в рамках этого ограничения.