SemanticHub – искусственный интеллект и когнитивные технологии для фармкомпаний

«Мы можем «прочитать» и проанализировать миллионы документов, чтобы оценить перспективы нового препарата или потребности пациентов и врачей». О том, как семантические технологии могут стать бизнесом, рассказывает сооснователь проекта SemanticHub Ирина Ефименко.

Команда SemanticHub
Команда SemanticHub

Идея

Как компьютерный лингвист, давно занимаюсь семантическими технологиями, как и некоторые мои партнеры по бизнесу. Это анализ и структурирование «больших текстовых данных» с помощью специальных программ на основе искусственного интеллекта. Суть в том, что мы обрабатываем тексты не просто по ключевым словам, а с пониманием смысла, с учетом всевозможных способов описания в текстах объектов, фактов, динамики развития ситуации. Современные технологии понимания естественного языка это позволяют.

В какой-то момент у нас возникла мысль создать компанию, чтобы использовать семантику для высокотехнологичных отраслей. Идея была в том, чтобы выполнять мониторинг возникающих трендов и выявлять перспективные технологии. При этом предполагалось, что наши разработки позволят делать это универсальным образом для любой предметной области.

Запуск

В 2015 году мы создали компанию. На этот момент у нас уже были первые продажи. Клиентов находили по принципу шести рукопожатий. Поскольку все основатели компании работали в областях, связанных с высокотехнологичным бизнесом, то среди знакомых были предприниматели, которых интересовала аналитика на основе больших данных. Они, в свою очередь, рекомендовали нас своим знакомым, другим компаниям. Так мы заключили первые несколько контрактов.

Сначала мы предполагали, что сможем выполнять типовые проекты по выявлению перспективных технологий. Но, когда мы приходили к заказчикам, каждого из них интересовало что-то свое. Задания были масштабные. Например, полный анализ рынка США в определенной отрасли. Но с каждым проектом мы понимали, что нам приходится очень быстро погружаться в новые сложные темы, настраивая на них наши технологии. При этом заказчики чаще всего не могли сформулировать «критерии успеха»: анализ больших данных привлекал их как «горячая тема», однако они не понимали, что именно могут – и хотят – получить в результате такого анализа. Таким образом, эта ситуация была невыгодна и для нас, и для клиентов. В целом, вроде, результат их устраивал. Но чего-то не хватало для полного счастья. Однажды заказчик сказал нам буквально следующее: «В общем-то, все хорошо. Но вот если бы вы помогли мне найти зеленых человечков, тогда я был бы действительно доволен…».

Тогда мы поняли, что невозможно больше «искать зеленых человечков» и решили сфокусироваться на той предметной области, где наши технологии были бы наиболее востребованы. С этой задачей мы пошли в акселератор ФРИИ, благодаря которому нам в итоге удалось выйти на новый уровень в нашем бизнесе. Там мы проверили ряд гипотез. И решили остановиться на фармацевтике.

После прохождения акселерации G4A Moscow 2017 мы начали наше взаимодействие с Bayer, где мы получили отраслевую экспертизу. Посмотрели, как работает большая фарма изнутри, погрузились в бизнес-процессы, поняли потребности отрасли.Один из примеров – пилотный проект для дивизиона Consumer Health по семантической обработке реальных данных большого объёма. Такой анализ помог лучше определить потребности аудитории, получить уникальные инсайты, что внесло свой вклад в развитие маркетинговой стратегии компании.

Это был очень важный для нас опыт. В этот же период мы заключили несколько контрактов с другими компаниями.

Продукт

Сейчас мы предоставляем фармкомпаниям два продукта. Первый направлен на выявление перспективных разработок в области инновационных препаратов. Это могут быть разработки и на поздней стадии, и на самой ранней – в зависимости от целей компании-заказчика. Наше программное обеспечение «читает» миллионы документов – научные статьи, патенты, результаты клинических исследований, материалы из бизнес-изданий. А результатом является рейтинг разработок в заданной области с указанием всех значимых параметров, факторов риска и успеха.

SemanticHub успешно провёл пилот со штаб-квартирой Bayer. Цель проекта - проанализировать тысячи разработок в выбранной области и отобрать наиболее перспективные соединения ("кандидаты в препараты"), которые могут стать основой прорывной терапии. В дальнейшем выявленные перспективные кандидаты исследуются высококвалифицированными экспертами Bayer и по ним проводится глубокий научный DueDiligence. Таким образом, SemanticHub не заменяет экспертов фармкомпаний, но работает с ними в синергии, избавляя их от рутинной работы, выявляя на "больших данных" факторы риска и успеха для инновационных разработок.

Другой продукт связан с анализом потребностей пациентов, их близких и врачей. Мы обрабатываем сотни тысяч комментариев, сообщений на специализированных интернет-площадках: пациентских форумах, телемедицинских платформах, сайтах консультаций врачей и пациентов и т.п. В результате заказчик получает развернутый отчет, где представлен полный ландшафт интересов, потребностей, проблем целевой аудитории, ответы на интересующие заказчика вопросы, результаты проверки гипотез фармкомпании. Это важно, например, для разработки оптимальной стратегии продвижения препарата, а также для поиска медицинских «инсайтов».

Мы умеем анализироватьразличные тексты и на различных языках. В первую очередь, мы «сканируем» интернет. С другой стороны, анализируем базы данных – например, научных публикаций. Это могут быть и закрытые интернет-ресурсы: для того, чтобы их обрабатывать, мы заключаем партнерства с владельцами таких площадок. Это взаимовыгодное сотрудничество: у них есть ценный контент, у нас – технологии его обработки. Также иногда заказчик предоставляет доступ к массивам своих внутренних документов.

Специальный робот собирает документы по нужной теме из различных источников и затем отправляет их так называемому лингвистическому процессору. Это сердце и мозг наших технологий. Он умеет «понимать» тексты. Лингвистический процессор извлекает из текстов сведения о значимых объектах, всевозможных фактах, связях и паттернах ситуаций и превращает «многабукв» в базу знаний по интересующей заказчика проблематике. На основе такой базы знаний уже формируются аналитические отчеты, инфографика. Причем может быть оформлена подписка, позволяющая заказчику в любой момент обновить информацию: например, для того, чтобы увидеть, как на аудиторию пациентов повлияла та или иная кампания.

Конкуренция

И в России, и в мире есть ряд компаний, которые развивают технологии анализа текстов в разном смысле слова. Есть очень мощные игроки. Например, в России среди лидеров – компании ABBYY, Яндекс. Есть и небольшие игроки.

Однако заказчику важна не только и не столько технология, сколько сам продукт – то, как технология «упакована» для решения реальных задач клиента. И в этом смысле, думаю, в области фармацевтики для России мы уникальны. Очень важным является глубокое погружение в бизнес заказчика. Сейчас мы уже очень хорошо понимаем особенности функционирования отрасли, потребности фармкомпаний, хотя разобраться во всем этом было непросто. У нас есть уникальные разработки, которые моделируют реальные процессы принятия решений внутри фармкомпаний. При этом наш продукт не заменяет экспертов заказчика, а работает с ними в синергии.

За рубежом у нас есть несколько непрямых конкурентов, прежде всего, в США. Их преимуществом являетсяблизость к штаб-квартирам ведущих фармкомпаний. Но они решают немного другие задачи. У нас своя упаковка.

Есть и другой тренд – в последнее время ведущие фармкомпании создают внутренние подразделения, специализирующиеся на анализе больших данных, разрабатывающие решения в области искусственного интеллекта. Это подтверждает растущие «цифровые» потребности фармы. Но эти команды являются для нас не конкурентами, а, скорее, хабами, которые помогают внутренним заказчикам находить такие компании, как наша.

Масштабирование

Сейчас мы работаем, в основном, на российском рынке и в настоящий момент активно выходим на мировой рынок. Важную роль в этом играют наши клиенты и партнеры – российские офисы ведущих международных компаний. Хороший «нетворк» в этой области особенно важен: все, кто работали с фармой, знают, что это сложная, медленная отрасль и контракты здесь быстро не заключаются.

Одно из наших главных богатств – это наши менторы, формирующие AdvisoryBoard: это высококлассные эксперты с опытом работы на международном рынке, в т.ч. в области фармы и медицины, на топовых позициях.

Команда

Как мы любим шутить, у нашей команды в совокупности около ста лет опыта работы в области автоматического анализа естественных языков. Я лично работаю в этой сфере более 15 лет, у меня образование и диссертация в области компьютерной лингвистики. Наш директор по науке разрабатывает технологии анализа текстов и искусственного интеллекта уже около сорока лет. С некоторыми ключевыми членами команды мы работаем вместе уже 10-15 лет. Важно и то, что мы знаем всех ключевых экспертов в этой области на российском и, во многом, на международном рынке.

Сотрудники нашей компании – это, чаще всего, специалисты, найденные через личные связи основателей или ключевых членов команды. Это высококвалифицированные эксперты, как правило, из мира высокотехнологичного бизнеса или науки. Мы никого не нанимаем «по объявлению». Молодых сотрудников мы подбираем среди наиболее талантливых студентов ведущих вузов (наш директор по науке преподает в МФТИ, я веду курс по компьютерной лингвистике в НИУ ВШЭ).

К настоящему моменту у нас есть только один сотрудник, которого мы не знали ранее. Но мы очень ей довольны. Раньше она работала в фарме. Пришла на менеджерскую позицию, услышав о нас на одном из мероприятий.

Сейчас у нас порядка 20 сотрудников. У нас замечательная атмосфера в команде, отличные сотрудники. И гибкий график. Сотрудники могут работать или удаленно, приезжая только на совещания и встречи, или в офисе – в зависимости от того, кому как эффективнее работается.

Монетизация

Средний чек сейчас составляет примерно 50-100 тыс. евро. Для российского рынка бюджеты контрактов ближе к нижней планке, для международного – к верхней.

Мы довольно гибкие, у нас есть разные варианты сотрудничества. Но типовая схема включает первый платеж и затем переход на подписку на обновления, стоимость которой рассчитывается как процент от стоимости контракта.

Метрики

Средняя продолжительность выполнения контракта – 3 месяца. Но это всегда интерактивная работа. Первые результаты заказчик получает в течение пары недель. В результате у клиента появляются новые, уточненныегипотезы, и ему интересно их проверить. Интерактивность и адаптивный дизайн – это важные преимущества для заказчика.

Все более глубокое погружение в отрасль помогает нам уменьшать сроки реализации контрактов. Теперь мы понимаем потребности заказчиков – часто еще до того, как начинаем переговоры. Кроме того, погружение в отрасль позволяет нам масштабироваться. До фокусировки на фарме каждый контракт выбивал нас из колеи – мы не могли выполнять несколько заказов одновременно. А в первые полгода после фокусировки на фарме наши продажи выросли примерно в 5 раз.

Перспективы

Наша главная ближайшая задача – выход на международный рынок, заключение серии контрактов со штаб-квартирами ведущихфармкомпаний мира. Прежде всего, это офисы в США и Западной Европе. Также мы сейчас рассматриваем возможности открытия зарубежного офиса, есть несколько вариантов его размещения.

В целом же,ключевая задача – это, конечно, продажи. Мы постоянно общаемся с участниками фармрынка. Мы участвуем во всевозможных мероприятиях и иногда сами их организуем. Например, мы организовали первую в РФ ежегодную конференцию «Большие данные и искусственный интеллект в фарме», в этом году будем проводить ее в третий раз. Недавно мы выиграли конкурс GlobalPitchRussia (http://globalpitch.vc) и выступили с питчем перед инвесторамив США (это было полезно и интересно, спасибо организаторам!), а после этого мы провели серию очень продуктивных переговоров с фармкомпаниями в нескольких штатах.

Конечно, с выходом на западные рынки сейчас есть определенные сложности. Во-первых, для некоторых зарубежных компаний российская «прописка» партнеров является барьером. Во-вторых, российская фармотрасль работает иначе, чем американская или европейская. Поэтому многие гипотезы, которые мы проверяли на российском рынке, нам надо заново перепроверять на международном уровне. Для этого необходимо выходить на нужных стейкхолдеров в штаб-квартирах, а в фарме это особенно сложно, т.к. каждая компания устроена по-своему. Играет роль и специфика отрасли в целом. В фармацевтике очень большое внимание уделяется вопросам конфиденциальности. Партнеры фармкомпаний, включая нас, обязательно проходят сложные проверки в области безопасности, здесь длинный цикл заключения контракта. В фармотрасли трудно стать своим. На российском рынке нам это уже, пожалуй, удалось. Следующий шаг – преодолеть все барьеры на международном рынке.

Если вы думаете о начале ИТ-бизнеса в этой сфере – следует очень серьезно все взвесить и, возможно, выбрать другую отрасль. Действительно ли вам хватит драйва и упорства пробиться на этот рынок? Но для нас уже нет дороги назад – мы сделали свой выбор. И нам очень нравится эта работа. Она безумно тяжелая, но очень интересная. Мы влюблены в фармацевтику и в своих заказчиков. И это главное.

33
Начать дискуссию