MedStat Solutions. Анализ медицинских данных, где здесь деньги и почему в этот рынок не заходят гиганты?

MedStat Solutions. Анализ медицинских данных. К такому названию компании и описанию сферы деятельности мы с партнёром пришли. И вот как это было…

В июле 2023 к моему другу-однокурснику, с которым мы вместе учимся в НИУ ВШЭ на «Прикладной Математике», через знакомых обратились за помощью. Врач, который писал кандидатскую работу (как мы позже выяснили), принёс данные по 500 пациентам (конечно данные обезличены!), где описаны их различные медицинские показатели, и попросил поискать зависимости. Давайте, к примеру, это будет что-то такое: «я думаю, что пациенты, которые в детстве принимали красные таблетки чуть реже болели x, y, да и вообще показатели у них как-то получше. Мне так кажется. Можешь посмотреть так ли это, если да, то можешь это как-то подтвердить статистически. Да и может там ещё что-то связано друг с другом».

MedStat Solutions. Анализ медицинских данных, где здесь деньги и почему в этот рынок не заходят гиганты?

Несколько недель работы с тем, с чем мой друг сталкивался только косвенно, ночи, проведенные на Хабре/StackOverflow и проект готов. По соотношению деньги/затраченное время это была не «тёплая ванна», как говориться (если я вообще не к месту в этой статье применяю устоявшиеся для меня фразы, напишите в комментариях, я буду благодарен и буду пытаться их использовать более уместно)). После, на две недели этот случай успешно канул в лету.

За месяц до этого мы с моим другом-одногруппником поставили еженедельные созвоны, чтобы как минимум час времени в неделю сидеть и думать на чём мы можем заработать деньги, совместив наши компетенции: в тот момент друг работал в крупном российском банке аналитиком, а я был руководителем отдела продаж (как так получилось отдельная история). У моего приятеля уже витала в голове идея помогать 10, 11-классникам определяться с вузом, опираясь на их знания, интересы и потенциал развития, используя разного рода олимпиады, курсы подготовки и т.д. (от идеи до реализации целая пропасть, так что готов открыто ей делиться. Если кто-то решится этим заняться, я держу за вас кулачки). После нескольких недель исследования увидели вариант реализации с огромным количеством денежных вливаний, сильными конкурентами и годы работы в минус. После нескольких лет по нашему плану были большие деньги😁, но гигантские вливания, требующиеся вначале, нас пугали. Как говорится, нас ожидала не «тёплая ванна»). Пишите в комментариях👇, если считаете нас трусами (ударение на у!).

На созвоне, на котором мы оставили идею со школьниками на будущее, мы сразу же решили чем можем заняться сейчас: пойти к врачу, который просил анализ данных и задать ему несколько интересующих нас вопросов. Так и сделали) Оказалось, что при написании кандидатской/докторской выдвигается какая-то гипотеза, которая после рассмотрения нескольких сотен случаев подтверждается или опровергается. Для этого в течение нескольких лет (самые быстрые справляются за полгода-год) врачи собирают данные по своим пациентам и идут всё это анализировать. Получается датасет в несколько сотен строк и несколько десятков столбцов. Для примера, пусть у нас будет 500 пациентов и 30 показателей по каждому. Получаем 500 х 30 = 15 000 ячеек с данными. Хоть мы и с прикладной математики, убивать ваш интерес подсчетом количества потенциальных зависимостей я не буду) Если кратко, задача не из приятных. Особенно для врачей, которые всю свою жизнь изучали анатомию, физиологию, разные болезни и т.д. Однако помочь с этим никто почему-то не брался (по итогу мы узнали почему, ответ будет чуть позже по истории).

Единственные, кто этим могли заниматься: это статисты (коллеги научных руководителей, дяди лет по 50, которые на самом деле хорошо освоили Excel, но не связывались с python и machine learning). И я их прекрасно понимаю. В свои 50 я хотел бы думать про отдых, детей и внуков, а не про то, как бы мне освоить новый язык программирования. В то же время бывали и радикальные случаи. Из реальных кейсов: статист мог запить, ошибиться и не исправить или просто через месяц отказаться от работы.

MedStat Solutions. Анализ медицинских данных, где здесь деньги и почему в этот рынок не заходят гиганты?

Отдельного рынка анализа медицинских данных для статей не было. Были компании, занимающиеся анализом данных для больших корпораций (проверить эффективность таблетки или эффективность модели управления - наверное, что-то такое) и компании, оказывающие анализ любых данных для b2c. Но так как вторые не специализировались на медицинских кейсах, для них было сложно разбираться в чём-то незнакомом и делать это они готовы были за 80-100k, а работы там на 30-40 часов. Учитывая, что медики становятся на ноги в финансовом плане в большинстве своём после 30, сумма это серьезная. Короче, мы увидели возможность и пошли туда. Занимаемся анализом медицинских данных для врачей, которые пишут научные статьи, кандидатские, докторские. Рынок не большой - пару тысяч человек в год и пока меньше 10% знают, что есть кто-то кроме горе-статистиков, кто может им помочь. Кстати, в предыдущем предложении был ответ на вопрос “почему сюда не заходят большие компании”. Им это неинтересно: несоответствие затраченных на новую сферу сил к прибыли, которую они могут тут получить. По нашим самым радужным подсчетам рынок по России 5-7 миллионов рублей в месяц. Это потенциальный оборот. Учитывая маржинальность в 30% (к которой стремимся) потенциальная прибыль выходит около миллиона в месяц. И это при условии захвата более 50% рынка и налаженных бизнес-процессах. Поэтому корпорации сюда и не заходят. А для нас самое то. Первый принцип партизанской войны (по Джеку Трауту) звучит так: «найдите достаточно маленький сегмент рынка, который вы бы смогли защитить». Кто-то скажет, что это не “маленький”, а “крохотный” рынок. Ну что ж 🤷‍♀

Скоро будет год, как мы создали компанию. Средний чек у нас около 30k (заказы в основном от 20 до 40k), что очень приятно для врачей, которые обращались на рынок анализа данных и видели ценники по 80-100k. Ещё одним знаком того, что идём в правильном направлении, для нас являются отзывы от комиссий (эти отзывы нам передают наши клиенты). Сейчас аналитикой данных с машинным обучением, красивыми графиками и сложными зависимостями не удивишь никого в финансовом, строительном или даже товарном секторе, а вот для медицинских комиссий это прям в новинку. Надеемся, что повышением стандартов нам получится заработать и сделать наш медицину чуть более красивой и понятной)

В процессе нас кинули на лендинг, был слив денег на неработающий канал привлечения лидов, уход сотрудников и заказ, с которым мы справились чудом (думали, что это будет первый случай, когда мы напишем клиенту, что не получилось и вернём деньги). Это всё мы прошли и сейчас помогаем врачам пройти путь от их наблюдений к научным открытиям! Звучит красиво и нам это нравится. Когда работа имеет еще и некую социальную значимость, начинать рабочий день приятнее)

Буду рад советам, комментариям, критике и вашим историям До новых встреч 👋

99
16 комментариев

А на каких библиотеках питона работаете? Если будете еще статьи о успехах/результатах публиковать, покажите, что за графики красивые делаете

2

А если чуть подраскрыть:
для работы с данными используем достаточно классический набор библиотек, таких как: pandas, numpy, scipy. Для машинного обучения используем sklearn и CatBoost. При работе с визуальной частью plotly безусловно номер 1, однако, seaborn и matplotlib, конечно также вносят свою лепту. Для отдельных задач могут использоваться и более экзотические библиотеки, но фундамент таков

1

Звучит как начало истории успеха из фильмов и книг) Вообще интересная тема, надо поторопиться только, пока яндекс и сбер все на свете себе не забрали)

2

Удачи вам! Надеюсь, медицина станет не только красивее и понятнее, но и прогрессивнее вместе с вами)

2

Спасибо 🥰 Будем стараться

Ребята, не хватает деталей про результат. Примеров. Визуализации. Хотя уверен, что вы займетесь другим продуктом немного позже. Смотрите по сторонам. Удачи!

1

Андрей, да, тоже вот подумали, что примеры (графики) работ были бы кстати. В следующий раз ключу
Подскажите, а почему есть ощущение, что займёмся другим продуктом немного позже)?

1