DataHub: от идеи с vc.ru до реализации платформы за 2.5 месяца

Привет, меня зовут Андрей Шмиг и я основатель и разработчик сервиса DataHub - Crowd Data Sourcing at Hand. Расскажу, как от интернет-магазина скриптов продаж дошел до продажи структурированых данных и почему продажа результатов интеллектуальной работы это всегда интересно.

Данные, которыми можно поделиться, купить или продать.
Данные, которыми можно поделиться, купить или продать.

Предыстория

Почти 9 лет мы с партнёром занимались колл-центрами, удаленными отделами продаж и сдачей операторов в аренду - через наши руки прошли такие проекты как ЕМИАС, ВВ (Вызов врача на дом), ЕДЦ (Единый диспетчерский центр) и множество коммерческих B2B проектов.

Года три-четыре назад мы вышли на продажу франшизы имея своё собственное ПО по управлению финансами, телефонией, роботами и воронками продаж (workflow заявок, если быть точным) - iCSP (Intelligent Customer Service Platform с патентом на разработку). Продали 20 франшиз, а потом решили, что с нас довольно и избавились от всего. От всего, включая один из маленьких, но полезных сервисов, который родился внутри компании - конструктор скриптов продаж с виджетом для amoCRM и встроенной базой сценариев.

Те, кто хоть как-то сталкивался с колл-центрами или аутсорсингом продаж понимают, что 80% времени ты работаешь над одноразовыми проектами под которые у тебя скрипт + база + телефония. Если с базой и телефонией изначально было всё понятно, то со скриптами мы встряли, потому что не все франчайзи умели писать скрипты, а не все скриптологи были одинаково хороши. Оптимальным на тот момент нам казалась идея разработать базу готовых шаблонов скриптов продаж и дать доступ к ней всем нашим франчайзи, а во внешний мир эти скрипты продавать.

На момент запуска интернет-магазина скриптов у нас не было иллюзий по финансам - миллионов не ожидали, вкинув пару тысяч в рекламу и ужаснувшись стоимости лида и конечной покупки мы отложили это дело и позволили сервису плавать самому на SEO-трафике.

Медленно, но верно, сервис начал приносить доход. Именно в тот момент, даже с количеством покупок скриптов в месяц около 10-15 шт, я начал понимать, что этот формат мне нравится - 0 претензий, минимум контактов с недовольными клиентами, минимум запросов на "переработать" или "добавить ещё возражение", больше благодарностей от пользователей в чате поддержки, никаких возвратов.

Сервис продаётся вместе с остальным бизнесом и влажные мечты о потоке денег с минимумом усилий улетучиваются с небывалой скоростью, но тёплые воспоминания остаются ещё на долгое время.

Парсинг сайтов и Максим Кульгин

Есть на свете герои, на vc.ru их тоже хватает и одним из таких был - Макс Кульгин, который достаточно часто публикует и публиковал статьи по теме парсинга сайтов, а так же разрабатывает сервис по защите от скликивания рекламы.

На тот момент, когда я только знакомился с первыми его статьями по парсингу сайтов и доходам с этого направления, у меня было ровно 0 мыслей, что я полезу в это направление. Причины? Низкий вход, большая конкуренция, низкая маржинальность, проектная работа.

Чтобы убедиться в количестве конкурентов достаточно было зайти на Kwork и поискать запросы на написание парсеров или предоставление услуг парсинга.

Кровавый океан индивидуальных разработчиков и организаций.
Кровавый океан индивидуальных разработчиков и организаций.

Тем не менее, читал статью за статьёй от Максима - иногда внимательно, а иногда по диагонали и прекратив вовсе читать после получения им гранта от ФСИ на исследования для сервиса по скликиванию рекламы. В то же время я был подписан на его телеграм канал в котором было больше воды, но и больше целевой аудитории хоть как-то заинтересованной в его направлениях с постоянными обсуждениями и сериями вопрос-ответ.

За один из таких вопросов я и зацепился: почему не думаете над сервисной историей и не реализуете что-то более масштабируемое?

Действительно, почему? По словам самого Максима в чате - желание есть, а вот идей - нет.

Идей нет, но вы держитесь там!
Идей нет, но вы держитесь там!

С одной стороны было странно слышать, что нет идей, хотя на рынке есть много примеров организаций, которые продают нишевые данные - export-base, или rusprofile, или dadata. С другой стороны - картина мира одного человека не может быть идентичной картине мира другого человека, поэтому взгляды на этот бизнес могли сильно отличаться у Максима и тех людей, кто ему эти вопросы задавал.

В этой истории меня больше цеплял уже не сам факт отсутствия идей у коллег по ИТ, а то, что у меня в голове начало вырисовываться после изучения его статей, комментариев в чате, заявок на Кворке и направления связанного с данными в целом.

Я начинаю углубляться и смотреть дальше... смотреть на...

Открытые государственные данные

Сомневаюсь, что есть на vc.ru люди, которые не слышали про rusprofile и подобные сервисы, которые перепродают данные ФНС на регулярной основе - выгружают, чистят, склеивают, отображают и предоставляют платный API или доступ из личного кабинета. Чем вам не бизнес?

150 000 руб стоит годовая "подписки" на эти данные от самой ФНС, но кроме ФНС есть и другие ведомства, которые открывают данные и их можно бесплатно выгрузить в форматах JSON, XML, CSV.

На vc.ru не единожды уже мелькали статьи тех, кто на добровольных началах эти данные приводил в порядок и открывал широкой публике бесплатно, что начало меня наводить на мысль о необходимости разработки единого подхода к решению проблемы доступа (поделиться, купить, продать) к структурированным данным, как коммерческим, так и публичным (бесплатным).

В другой аналогичной статье разработчик собирал донаты - 200 000 рублей на новые сервера. Собрал ли он в итоге донаты не знаю, но попытки есть и они будут повторяться.

Если смотреть на это направление, как на потенциальный бизнес, то каждый желающий пройдет через следующие этапы:

  • Разработка сервиса;
  • Закупка данных;
  • Подключение оплаты;
  • Маркетинг;
  • Договора, акты, счета.

Если брать каждый пункт отдельно, то проблем нет, но как только пытаешься брать все пункты, то понимаешь, что становишься в один ряд со множеством других компаний и вступаешь с ними в прямую конкуренцию. При прочих равных начинает решать маркетинг, который, чаще всего, у чистых разработчиков уровнем ниже их скиллов по разработке. Привет из статьи Романа Рабочего про маркетолога и никому ненужный (в кавычках) сервис.

Заходить конкретно в это направление у меня желания не было. Почему? Высокая конкуренция, необходимость в большом маркетинговом бюджете на старте, отсутствие уникальности предложения (какое интересное УТП тут может быть?), работа с B2B в чистом виде. НО! Деньги тут есть, а значит само направление государственных данных отбрасывать не стоило.

Отличаются ли процессы продажи данных парсинга сайтов от продажи данных ФНС чем-то? Нет. Абсолютно.

Куда двигаться дальше?

На этом этапе стало четко понятно, что мне интересно этим заняться - продажей данных любого рода, но вопрос оставался - как именно к этому подойти так, чтобы не прогореть и по пути не выгореть.

Во-первых, от прямой конкуренции я отказался сразу, потому что борьба с крупными / средними компаниями в поле маркетинга и бюджетов это не то, куда мне хотелось погружаться и я понимал, что на реализацию идеи (будущей) будет достаточно ограниченное время и бюджет. Если борьба с индивидуальными разработчиками, то полем борьбы становится опыт в этом направлении (если несколько лет продаешь на Кворке парсеры, то очевидно, что уже есть под рукой много готовых решений), а так же стоимость оказываемых услуг - демпинг, что не менее ужасно.

Во-вторых, мне, по сути, необходимо будет технологически и по опыту догонять тех, кто в этом бизнесе дольше, а значит отставание будет на протяжении первых 3-6 месяцев, что не сильно радовало.

Опыт интернет-магазина скриптов продаж подсказывал, что стоит применить такую же модель - платформа. Открытая платформа, где пользователи смогут делиться, покупать и продавать данные. И, в качестве безопасного варианта, на случай провала самой платформы, как инструмента распространения структурированных данных любого рода - самому становиться пользователем, который собирает, публикует и продаёт данные.

Со скриптами продаж было аналогично - франчайзи разрабатывали, мы добавляли скрипты с их согласия в базу и продавали. Если у нас самих была возможность разработать скрипт в свободное время и добавить в интернет-магазин - мы это делали. Почему бы и сейчас не применить такой подход?

Его я и решил применить смешав ещё с несколькими моделями (бизнеса и аудиторий), которые на протяжении некоторого времени влияли на моё представление о том, что должно в результате получиться - машинное обучение и data-science.

Следующая часть будет интересна разработчикам, аналитикам и дата-саентистам - я покажу, как работать с бесплатными, спонсируемыми и коммерческими репозиториями данных на платформе DataHub.

Если вам понравилась статья - ставьте лайк, подписывайтесь на канал DataHub на vc.ru и вступайте в чат поддержки сервиса в Телеграм.

Оставляйте свои вопросы и я отвечу на них, а если необходимо - дополню статью. Понимаю, что в статье может быть некоторая незавершенность и недосказанность, поэтому буду искренне рад, если в комментариях подскажете, чем дополнить.

11
2 комментария

Ссылка на DataHub редиректит на другой сайт, еще и с вирусами (

Проект свернул, домен выкинул.