Растягиваем данные о пешем трафике Москвы и Новосибирска на всю Россию с помощью машинного обучения

Меня зовут Анатолий Серебрянский, я основатель и руководитель сервиса анализа коммерческой недвижимости Gisbuyer. Мои статьи здесь о нашем проекте — можете посмотреть в моих публикациях.

Сегодня я хочу рассказать о нашем ближайшем плане развития и посоветоваться.

К нам обращаются большие сетевые компании, которые вы все знаете, и переговоры заходят в тупик, из-за того что мы имеем малую географию покрытия сервиса. Компаниям нужно больше городов чтобы начать с нами сотрудничать. После 5 таких крупных запросов, становиться обидно упускать эти возможности .

Вся наша команда задалась вопросом - как масштабироваться в тех условиях, которые есть сейчас. А сейчас у нас есть всего 2 продукта, которые приносят деньги:

  1. Розница Москва и Новосибирск (с пешим трафиком)
  2. API Москва и Новосибирск (с пешим трафиком)
  • Также у нас есть пул данных с количеством жителей в домах, инфраструктуры и еще кучей всего. Эти данные покрывают всю Россию но мы их не используем.
  • И конечно уже идет органический трафик из поисковых систем, по большей части трафик интересуется своими городами.

Единственная гипотеза, которая сейчас нам кажется подходящей - загрузить имеющиеся данные по другим городам и продавать анализы без пешего трафика. Да, понимаем скажите “Ведь пеший трафик самое ценное”, согласны. Но поверьте, проанализировать даже инфраструктуру и достать данные о количестве жителей - та еще задача для технически не подкованных предпринимателей.

Есть ещё вторая гипотеза, которую мы обходили стороной, но видимо пришло ее время. Еще в 2018 году у нас была мысль вкрутить в проект машинное обучение. Но тогда перспективы были туманны и шла речь о выживании проекта и поиске модели получения денег. Отодвинули эту историю.

Хотели сделать вот что - скормить машине все данные о трафике, об инфраструктуре, о жителях в домах, геометрии дорог, количестве населения в городе и еще кучу всего.На выходе планировали получить модель, которая сможет достаточно точно предсказывать кол-во пешеходов в любом городе но уже оперируя всеми данными за исключением данных о пешеходах.

Растягиваем данные о пешем трафике Москвы и Новосибирска на всю Россию с помощью машинного обучения

В 2019 году у нас появилось конкретное предложение обработать наши данные на стороннем проекте и проверить гипотезу. Сотрудничества не произошло.

Год 2020. Пишем здесь статью и получаем примерно такой отклик от читателя: “О, я вижу что вы команда энтузиастов, я занимаюсь машинным обучением и мне хочется поработать с вашими данными.”

Парень имеет наработки, в общении адекватный, решили коллаборацию провернуть. Он не в курсе правда, отпишемся ему в понедельник. Долго обсуждали с командой, в этом есть большой риск.

Мы хотим задать вопрос всем, кто разбирается в машинном обучении, каков ваш вердикт? Получится ли запилить точный алгоритм? Может это мы видим мир в розовых очках?) Ждем ваших комментариев.

P.S. Новости о нашем проекте. Мы начали интеграцию с сервисом объявлений коммерческой недвижимости arendator.ru. Кнопка подсчета пешеходного трафика на портале пока есть не везде - тестируем интеграцию. Но вы уже можете найти эту кнопку от нашего сервиса, в карточке объекта, это выглядит так - “Анализ пешеходного трафика возле..”. Вот например объект с нашей кнопкой

Растягиваем данные о пешем трафике Москвы и Новосибирска на всю Россию с помощью машинного обучения
44
5 комментариев

Всё-таки не понятно, что конкретно вы делаете.

2
Ответить

Все-таки, действительно, не совсем понятно какие у вас есть данные для обучения модели. Правильно, понимаю, что вы хотите собрать данные по населению, дорогам итд по городам России и использовать их для обучения модели?
Теоретически это может сработать, но во-первых, может занять очень много времени, во-вторых может вызвать недоверие со стороны клиентов если вы скажете что у вас не реальные данные пешеходного трафика, а моделируемые. В-третьих, вопрос как проверять точность модели.
А разве сотовые операторы уже не продают данные о перемещении клиентов? В обезличенном виде, конечно же.

2
Ответить

У нас обезличенные данные о координатах мобильных устройств по Москве и Новосибирску. Сейчас сервис работает на этих данных. Берём мы их не у сотовых операторов, и это дорого чтобы быстро масштабироваться, у сотовых операторов это ещё дороже . 

Ответить

Здравствуйте Анатолий. Ввел адрес для анализа трафика на Gisbuyer.com
Сайт ничего не показал, но предложил оплатить 500 р.
Нет понимания за что нужно платить - просьба сделать демо результатов, которые я получу или бесплатный период для тестирования.

1
Ответить

Делали бесплатный период - люди начинают делать много регистраций и пользоваться только бесплатным периодом. Поэтому сейчас так, там видно что за данные вы получите и большая часть данных показывается до оплаты, кроме самой ценной информации о пешем трафике. Планируем сделать кусок карты демонстрационный 

1
Ответить