Как заработать на статистических исследованиях для учёных по всему миру

История развития сервиса для обработки данных Statzilla.

Екатерина Власенко открыла компанию Statzilla 2,5 года назад после учебы в Европе. Оказалось, что в Ростове-на-Дону (да и не только) анализ и статистическая обработка данных для научных исследований и бизнеса востребованы на высоком уровне. Появился онлайн-сервис, который в течение минуты готовил статистические отчёты для различных исследований. “Мы хотели в меру своих возможностей повысить качество российской науки в мире. У нас не было цели делать бизнес ради бизнеса”, - признаётся Екатерина Власенко. Но бизнес принёс деньги: прибыль за два года составила 2 миллиона рублей. Как у неё это получилось?

<i>Екатерина Власенко</i>
Екатерина Власенко

Собрали конструктор

К созданию бизнеса Екатерину Власенко подтолкнуло международное образование в сфере менеджмента в магистратуре CEMS MIM. Власенко была вдохновлена тем, как её ровесники в Европе с лёгкостью открывают своё дело и занимаются тем, что им действительно нравится.

Идея для бизнеса появилась благодаря коллеге по научной работе — Святославу Заруцкому (теперь он соучредитель компании). Он тоже экономист-математик. «У нас один научный руководитель, мы часто виделись на общих встречах. Пока я училась в магистратуре, он работал в Ростовском медицинском университете: делал статистический анализ для медицинских исследований. Стало ясно: ситуация с обработкой данных в медицине плачевная, с этим надо что-то делать. Так как мне всегда был интересен анализ данных, мы решили реализовывать это вместе», — рассказывает Власенко.

Сначала помогали делать аналитику медикам на проектной основе. После 40 выполненных задач в сфере медицины, биологии и психологии поняли, что многие процессы можно автоматизировать и начали разработку онлайн-сервиса. Cтруктурировали всевозможные аналитические задачи исследователей в медицине и свели обработку данных к конструктору: составлению отчета из ряда готовых компонентов.

«То есть мы и себе упростили работу над заказами, и для неспециалистов сделали такую обработку доступной за счет простого интерфейса», — объясняет Екатерина.

В июле 2015 года она зарегистрировала ИП и вместе с Заруцким открыла агентство по анализу данных. Главным продуктом компании стал онлайн-сервис по подготовке статистического отчёта для различных исследований в течение минуты. Офис в коворкинге получили бесплатно, сайт делали внутренними ресурсами.

Без автоматизации никуда

Как работает сервис Statzilla

Через два месяца после открытия партнёры увидели, что потребность в быстрой обработке данных у исследователей довольно большая. «Каждый клиент, который к нам обращался, просил сделать всё „еще вчера“, потому что обработка данных, хотя и трудоемкий процесс, но это только часть исследования, результаты нужно интерпретировать» , — вспоминает Екатерина Власенко. «Ручной» труд аналитиков должен был уйти в прошлое, была нужна автоматизация. В команду взяли четырёх программистов.

«Прелесть IT-стартапов состоит в том, что больших вложений вначале не требуется. Мы начинали работать на проектной основе, поэтому окупались с первого дня, — говорит Власенко. — Все, что зарабатывали (за исключением затрат на еду, конечно), вкладывали в разработку сервиса, оплату услуг программистов».

Почти сразу соучредители Statzilla столкнулись с первой проблемой — было сложно найти доступный канал для продвижения онлайн-сервиса. Продвижение через конференции, лекции и другой образовательный контент давало результаты, но было трудозатратным.

«Пока спрос нас находит сам. Специальных маркетинговых усилий мы не прикладываем, по мере возможности рассказываем о сервисе на мероприятиях. А вот масштабируемые каналы продвижения (контекстная реклама, SMM) пока до сих пор не настроили, как следует», — признаётся Екатерина.

Онлайн-сервисом и статистическими услугами компании пользуются исследователи (медики, биологи, психологи) от студентов до докторов наук как в частном порядке, так и в составе исследовательских центров и институтов.

Конкуренты онлайн-сервиса Statzilla — это частные специалисты по статистике, которые проводят аналитику с использованием пакетов статистического анализа, а текст пишут вручную. Их работа идёт существенно медленнее и стоит дороже. Косвенные конкуренты — это сами пакеты для обработки данных (Statistica, SPSS, Matlab и т.д.). Но все они требуют от пользователя знания статистики и математики.

«Мы создаём сервис, который доступен неспециалисту. К тому же мы единственные в мире, кто не просто реализует расчёты, но и предоставляет на их основе связный текст — выводы о данных (например, „в этой группе исследования наблюдаются статистически значимо повышенные значения такого-то показателя“, а исследователь уже сам объясняет, почему такое может быть)», — говорит Власенко.

Всю прибыль за два года — 2 млн рублей — реинвестировали обратно в развитие. Это было порядка 200 заказов по аналитике для науки (в том числе расчеты для более, чем 50 диссертаций) и 11 бизнес-проектов (в Statzilla почти сразу оказывали услуги по анализу данных и машинному обучению).

Потребности рынка в сервисе Statzilla (по подсчётам самой компании):

  1. Российские ученые, проводящие исследования в частном порядке, — медики, биологи, психологи, социологи — 1,4 млрд рублей (Оценка сделана на основе известного числа защит диссертаций по данным областям и среднего по рынку чека на анализ данных)
  2. Зарубежные ученые — больше 1 млрд долларов
  3. Российские медицинские исследовательские центры, кафедры медицинских вузов, НИИ. — 429 млн рублей.

Это не в космос лететь

<i>Statzilla решает задачи для бизнеса</i>
Statzilla решает задачи для бизнеса

Исследования компании имеют не только научную ценность, но и практический смысл. Для медицинских целей команда Statzilla провела исследование, которое позволило сокращать издержки и риски для пациента. Например, в урологии есть заболевание, для диагностики которого сейчас требуется отдельная операция. А предиктивная экспертная система Statzilla позволила определить пациентов, у которых по клиническим показателям такое заболевание крайне маловероятно, и для них уже не нужно делать эту диагностическую операцию.

Большую часть дохода компании (70%) приносят как раз b2b-проекты. Для одного клиента прогнозировали вероятность покупки на сайте. Сначала клиент, как это часто бывает, просто хотел решить глобальную проблему — повысить конверсию посетителей сайта, и, как следствие, прибыль. «Именно такой подход мы и любим, — говорит Святослав Заруцкий. — Когда нам дают конечную задачу, а вот методы ее решения уже на нас. У нас был похожий кейс:заказчик тоже хотел повысить продажи, но сам предлагал и контролировал методы исследования. До решения в итоге мы не добрались».

Чтобы найти решение, нужно понимать, что покупатели на сайте не будут сильно отличаться от «непокупателей» по отдельным факторам. Такое почти невозможно. Различие — это комбинация всех факторов, многофакторная модель или дерево решений. «Методы для науки и бизнеса — одни и те же. Мы не изобретаем велосипеды», — говорит Заруцкий.

Была типичная задача — прогноз вероятности — в данном случае покупки. То есть для бизнеса целевой показатель тут — покупка, для медицины Statzilla cтроила точно такие же модели, но целевой показатель там — выздоровление пациента. То есть это был не запуск ракеты в космос. И в том, и в другом случае Statzilla строит математическую модель, в которой участвуют факторы, которые связаны с покупкой/выздоровлением.

Сначала исследователи пытались понять, по каким факторам покупатели статистически значимо отличаются от «непокупателей». Весь процесс занял 2 месяца: нужно было рассмотреть все факторы, влияющие на покупку. Для этого вникали во все этапы, через которые проходит клиент на сайте. Анализировали время, проведенное на сайте, число отправленных сообщений в чате поддержки, характеристики профиля клиента на сайте (есть ли фото, телефон), сколько фотографий у клиента в соцсетях, в каких он состоит группах, какие слушает аудиозаписи.

Использование такой модели предсказания вероятности покупки каждого нового посетителя сайта позволило повысить конверсию в 2 раза. Заказ стоил несколько сотен тысяч рублей. Главная сложность была связана с тем, чтобы перейти от неточно сформулированных задач к точно сформулированным задачам анализа данных. И чтобы перейти от точных результатов анализа данных к их объяснению заказчику. «Но и это совпадает со сферой науки, — говорит Заруцкий. — На удивление ученый, ставящий эксперимент, также очень часто не понимает, что же он хочет оценить, посчитать, сравнить».

Машинное обучение и нейросети

Как заработать на статистических исследованиях для учёных по всему миру

Компания также помогает сегментировать покупателей — это инсайт для маркетологов. «В отличие от классической и уже малоэффективной стратификации по полу, возрасту, мы делим сегменты потребителей по ряду более детальных характеристик. Это дает возможность более точной, целевой настройки рекламы и, как следствие, более низкой цены клика/показа», — делится Екатерина Власенко.

Партнёры уверены, что по этой услуге конкурентов можно пересчитать по пальцам: «Это довольно уникальные задачи. Подобные услуги могут предложить лишь московские компании, занимающиеся машинным обучением. Маркетинговые компании с классическим подходом анализируют сегменты, но они не предлагают математических моделей, которые в режиме реального времени дают оценку вероятности покупки для клиента».

Екатерина признаётся, что у компании есть сложности с кадрами. «При всей популярности анализа данных и шумихи вокруг таких явлений как машинное обучение и нейросети, у нас нет хороших образовательных программ и соответственно нет специалистов. Есть, правда, много ребят, посмотревших пару образовательных курсов на Youtube, Coursera, но этого, мягко говоря, недостаточно. Поэтому выращиваем пока все компетенции внутри компании», — рассказывает Екатерина.

В Statzilla принимают аналитиков с уже базовым знанием классической математической статистики. Затем проводят внутреннее обучение по статистической обработке для погружения в специфику медико-биологических исследований. Новичков загружают практикой с первого дня — принцип «learn by doing». Дальше сотрудник выбирает наиболее интересное ему направление — классический статистический анализ или машинное обучение, и его подключают к таким проектам.

«Наша основная трудность кроется в маркетинге, — считает Власенко. — Наша целевая аудитория не подозревает, что есть простое решение их проблемы, и не ищет это в поисковиках. Рынок не всегда оказывается готов к сильно инновационному решению, как наше. Но у нас часто заказывают исследования во второй раз одни и те же клиенты: им нравится».

Молодая компания уже занимала призовые места в конкурсах «Молодой инноватор года 2015», «Эврика 2016», а в 2017 году стала победителем Национальной премии «Бизнес-Успех». Но развитие продолжается. Новое направление — это автоматизация маркетинговых исследований. В маркетинге используют те же самые методы статистической обработки данных, что и в медицине, биологии. Это перспективно, потому что те агентства, которые не просто считают арифметическое среднее, а делают именно статистический анализ, выигрывают на фоне конкурентов.

Компания только хочет тестировать этот рынок. «Ну и само собой, мы бы хотели выйти за рубеж, — добавляет Екатерина. — Сначала мы думали, что такой проблемы нет за рубежом, но за время моей поездки в США по программе для российских предпринимателей я выяснила, что там существуют те же самые потребности». Продавать на иностранных рынках планируют дороже. Например, час работы статистика в США стоит $200. Сервис переводят на английский язык, чтобы так же запустить тесты на новом рынке.

6464
56 комментариев

Мне кажется, я знаю ваше будущее! Вы поймёте, что b2b в вашем случае - это ручные и очень дорогие продажи. Ведь заработать за 2 года 2 000 000 рублей на 200 заказах - это очень мало, вы просто так долго не протянете :( Вы делаете интересную работу, но что-то мне подсказывает, что малый бизнес не понимает этот ингредиент. Тем более в России. Чего уж говорить, многие из них не делают конкурентные анализы, а тут мат.статистика, аналитика и прогнозы. В общем картина как всегда странная получается. Вы хотите реально помочь, предоставляете недорого свою услугу для всех, а пользоваться ею могут только опытные - и тут вопрос ребром: либо вам уходить в более маржинальные продажи, либо какое-то время обслуживать неплатежеспособный сегмент и уступить место конкурентам. Ребята, вы молодцы! Держите нос по ветру. Удачи!

5

Возможно это выглядит смешно, но им нужно попробовать себя для расчетов у гос. Заказчиков. СМБ скорее всего слабо взлетит.

1

спасибо :) хочется, чтобы и малый бизнес становился "умнее" за счет аналитики. И есть же у нас примеры, когда заказчики из малого бизнеса сами обращались к нам с пониманием необходимости такой аналитики. Так что мы верим, что в перспективе сможем сформировать спрос :) Но в отношении масштабирования сейчас, вы совершенно правы, высокомаржинальные продажи выглядят оптимистичнее

1

Кстати, 2 миллиона - это уже прибыль, обороты выше были, конечно.

Ребята, всё круто, у вас большое будущее. На основе существующих алгоритмов, вы просто можете наклепать по-быстрому темплейты, которые помогут объяснить конкретные области применения. Простым переименование колонок исходных данных и лёгким подкручиванием модели вы можете найти десятки и сотни real-life кейзов, сделать из них шаблоны с объяснениями конкретных целей исследований и кейсов - и делать маркетинг таргетированно на примерах конкретных кейсов. Много кто воспользуется

3

Спасибо, Илья! Да, это то, к чему мы стремимся, потому что пока понимаем, что "анализ данных" звучит очень широко и непонятно. Так что накапливаем пока библиотеку кейсов, чтобы сделать по каждому из них конкретное ЦП

2

речь только о биологии и медицине или исследования выполняются на разные темы?..

2