Учёные научили алгоритмы генерировать молекулы против фиброза и других сложных заболеваний — в 63 раза быстрее людей

Соавтор исследования и основатель компании Insilico Medicine Александр Жаворонков — об истории открытия, инвестициях и особенностях мировой фарминдустрии.

Александр Жаворонков на конференции Pioneers
Александр Жаворонков на конференции Pioneers

В сентябре 2019 года научный журнал Nature Biotechnology опубликовал статью международной группы учёных. В публикации исследователи рассказали о шести молекулах, смоделированных ИИ. Они способны бороться с фиброзом — разрастанием соединительных тканей в органах, которое приводит к постепенной утрате их функций.

В статье описан первый случай, когда учёные протестировали на мышах сгенерированные ИИ соединения и доказали их действие. В перспективе технология поможет в создании лекарств от болезней, которые учёные ещё не смогли вылечить, например болезнь Альцгеймера и рассеянный склероз.

На создание молекул и их проверку учёные потратили полтора месяца. Ранее на поиск и разработку подобных соединений для борьбы с фиброзом без участия ИИ учёным биотехнологической корпорации Genentech потребовалось восемь лет.

Первый автор публикации — Александр Жаворонков — учёный, основатель гонконгской компании Insilico Medicine. Алгоритмы компании использовались для научного исследования.

По мнению учёного, сгенерированные с помощью ИИ молекулы уступают по качеству соединениям, созданным ранее компанией Genetech. Тем не менее об исследовании написали Forbes, Wired, MIT Technology Review и другие. Статья стала четвёртой по количеству упоминаний за всю историю Nature Biotechnology.

Учёные научили алгоритмы генерировать молекулы против фиброза и других сложных заболеваний — в 63 раза быстрее людей

Исследования до генерации молекул

Ещё в начале 2000-х годов Жаворонков работал в компании, разрабатывающей графические процессоры и чипы материнских плат ATI Technologies. Он покупал акции разработчика, пока в 2006 году её не выкупил производитель электроники AMD.

Эта сделка позволила исследователю заработать и заняться своими проектами, а в 2014 году зарегистрировать компанию Insilico Medicine в США, которую потом перевёл в Гонконг. Новое расположение фирмы позволило получать инвестиции, поддержку и опыт из Азии и США и эффективнее управлять компанией.

Как рассказывает исследователь, за всю историю компании он вложил в Insilico Medicine больше $500 тысяч личных денег.

По словам Жаворонкова, одна из главных задач Insilico Medicine — помочь как можно большему количеству людей. Вместе с коллегами он решил, что борьба со старением — правильный путь для этого.

«Все люди разные: цвет глаз, рост, фигура. Некоторые могут болеть раком, болезнью Альцгеймера или диабетом. Однако всех объединяет возраст — все рано или поздно стареют», — говорит учёный.

По его словам, возрастные изменения накапливаются постепенно, поэтому их сложно заметить. Например, нельзя посмотреть на состав крови у нескольких людей и на основе этого сделать выводы об изменениях организма человека с возрастом. Решить проблему помогают глубокие нейросети, которые могут обрабатывать большое количество данных.

Учёные Insilico Medicine заинтересовались, как с возрастом меняются процессы в сигнальных путях — маршрутах, по которым внутри клетки движутся поступившие в неё сигналы, чтобы активировать или блокировать различные гены.

Например, исследователи показали возрастные изменения иммунной системы и активности сигнального пути mTOR, который отвечает не только за старение, но и за развитие онкологических заболеваний.

Затем Жаворонков и его коллеги стали изучать изменения в здоровых и нездоровых клетках, тканях, органах на уровне тех же сигнальных путей.

Сравнивать разные типы рака — это как сравнивать разные города после атомной бомбы. Очень много изменений и тонкостей.

Александр Жаворонков

Учёные фиксировали эти изменения состояний для поиска генов-мишеней, которые вовлечены в различные болезни. Воздействуя на них, можно лечить, например, фиброз лёгких или печени. Дополнительно изучали влияние медицинских препаратов на различные клетки.

Ещё в 2014 году, по словам учёного, произошла революция в глубоком машинном обучении. Тогда нейронные сети научились лучше человека распознавать паттерны в картинках.

Как рассказывает исследователь, никто раньше не верил, что это возможно, поэтому после прорыва компании стали больше вкладываться в развитие нейронных сетей и искать их применение в разных областях.

Спустя время, на фоне резких изменений в отрасли опытом Жаворонкова заинтересовались ИТ-компании. Его друзья среди топ-менеджеров Nvidia, с которыми он познакомился ещё во время работы в ATI Technologies, пригласили его, чтобы узнать побольше о результатах работы.

«Друзья позвонили мне и предложили прочесть им лекцию о том, как глубокое обучение можно применить в области биоинформатики», — вспоминает Жаворонков.

Исследователь съездил к знакомым в Калифорнию, где вместе с коллегами выяснил, что алгоритмы Insilico Medicine по анализу сигнальных путей и их влияние на отдельные гены можно расширить. Это позволило бы изучать не отдельные сигнальные пути, а целые каскады — несколько сигнальных путей в комплексе.

В тот же год Insilico Medicine научила алгоритм выделять основные группы генов и сигнальных путей, по которым он распознаёт рак.

Новые молекулы от ИИ

В 2015 году учёные компании столкнулись с новой проблемой. Они поняли, какие комбинации генов и мутации к каким типам рака относятся, но это не помогало лечить людей. У исследователей возник вопрос: «Как это использовать для поиска новых лекарств?»

Нужны были эксперименты, чтобы фармацевтические компании поверили:

  • Что мишени Insilico Medicine («продукт» гена, например белок; на мишени обычно направлено действие лекарств) действительно относятся к какому-то заболеванию.
  • Созданное под них лекарство может потенциально вылечить болезнь.

По словам основателя, все тесты необходимо делать для каждой отдельной мишени и показывать, что если этот ген «выбить» из какой-то модели, это повлияет на заболевание, с которым учёные связывали мишень изначально.

Тесты дорогие и занимают много времени, поэтому провести их для всех найденных мишений компания не могла. Её основателю и его команде пришлось бы выбирать из найденных мишеней отдельные, надеясь, что они сработают.

Нам такой путь не нравился — мы не эксперты в экспериментах такого плана. И подходящих партнёров — химических и биологических компаний, которые могли бы провести подобные исследования, — у нас тогда тоже не было.

Александр Жаворонков

Тем не менее в 2015 году швейцарская фармкомпания (название организации Жаворонков раскрывать отказался) дала Insilico Medicine повод заняться химическими разработками. Она предложила контракт, по которому учёные должны использовать ИИ для создания новых молекул против разных заболеваний.

Жаворонков ответил на предложение: «У компании кончаются деньги, а вы хотите, чтобы мы сделали то, чего не умеем». Фармкомпания сказала, что не будет сотрудничать с Insilico Medicine, если она не готова вести разработки в области химии.

Тогда исследователь встретил несколько учёных в области ИИ, которые занимались генеративными состязательными сетями. Это технология, при которой ИИ придумывает что-то новое на основе полученной информации.

Натренированная нейронная сеть может «представить» людей с определёнными свойствами. «Например, Брэда Питта с карими глазами и чёрными волосами», — говорит основатель.

Учёные хотели, чтобы нейросети придумывали новые молекулы, которые можно превратить в препараты для подавления или активации выделенных ими ранее перспективных мишеней.

Сейчас у Insilico Medicine около 800 оригинальных сгенерированных ИИ-соединений. Для некоторых исследователи тренировали сеть на миллионах молекул, а для других — на десятках тысяч.

Для такой работы нужны большие вычислительные мощности (точное количество оборудования и его цену Жаворонков не раскрывает): часть оборудования компания купила самостоятельно, часть — подарил разработчик Nvidia.

Исследователь вспоминает, что когда Nvidia стала поставлять для глубокого обучения систему Nvidia DevBox, его компания купила со скидкой самую первую машину (в 2015 году она стоила около $15 тысяч) из партии в 100 штук.

Сейчас мы активно используем облако Amazon AWS, где можем брать целые фермы GPU для вычислений.

Берём данные из открытых источников, в основном химические, — AWS подходит для этого. В последнее время Amazon сама начала инвестировать в агрегацию биомедицинских данных из публичных источников и начала предоставлять доступ к этим данным прямо через своё облако.

Александр Жаворонков

Изначально работа Insilico Medicine была теоретическая: учёные генерировали молекулярные структуры (какие именно, Жаворонков не раскрывает), но подтвердить наличие у них заданных свойств без экспериментов не могли.

Если нейросеть генерирует изображения или музыку, то человек сразу понимает хороший или нет получился результат.

«Сеть может нарисовать Брэда Питта, и человеку достаточно взглянуть на рисунок, чтобы понять, что перед ним на самом деле клякса или корова», — рассказывает учёный.

В случае с химией нельзя определить результат «на глаз» — приходится создавать реальные молекулы по структурам, которые придумал ИИ. Синтез новой молекулы, которую никто и никогда ранее не синтезировал, занимает от нескольких дней до полугода.

После этого созданную молекулу отправляют на тесты. Вначале in vitro (опыты вне живого организма — «в пробирке»), чтобы проверить, воздействует ли соединение на нужную молекулярную мишень. Потом молекулу тестируют на клетках, а после in vivo (на живых организмах), например мышах или крысах.

Жаворонков рассказывает, что синтез одного соединения стоит от $2000 до $10 тысяч.

Можно сгенерировать 30 тысяч молекул с заданными свойствами, но потом их все придётся синтезировать и проверять. При этом для каждого этапа тестов понадобится дополнительное количество вещества.

Если какая-то компания решает разработать для мишени молекулу, то вероятность, что с первого раза она будет работать, — 0%.

Это как запустить ракету в космос, где нужно протестировать каждую деталь. Однако полетит она или нет — не узнаешь, пока не запустишь.

Александр Жаворонков

Огромное количество рисков ожидает исследователей и на экспериментальном уровне, рассказывает учёный. Например, молекулу неправильно «сварили» или хранили в несоответствующих условиях. В итоге учёные не знают, был неправильный синтез молекулы или была допущена ошибка в постановке эксперимента.

Проверка молекул

Жаворонков вспоминает, что в конце 2017 года у Insilico Medicine вновь почти не оставалось денег. Тогда на компанию обратила внимание фармкомпания Juvenescence Джима Меллона. Ранее он инвестировал в биофармацевтическую организацию Medivation, которую потом за $14 млрд купил американский производитель лекарств Pfizer.

Juvenescence не нравилось, что компания исследователя занимаемся генеративной химией из-за высоких рисков в этом направлении. Тем не менее спустя несколько месяцев она вложилась в Insilico Medicine (точную сумму сделки Жаворонков не называет).

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Finsilico.com%2F&postId=92646" rel="nofollow noreferrer noopener" target="_blank">Сайт</a> Insilico Medicine ​
Сайт Insilico Medicine ​

Полученные деньги учёный потратил на синтез молекул: «Хотя, если честно, в то время мы сами не были уверены, что они будут работать», — комментирует основатель компании.

Исследователи обратились в самую большую контрактную научно-исследовательскую организацию (название компании Жаворонков не раскрывает), которая занимается синтезом молекул для всей мировой фарминдустрии.

Учёный рассказывает, что он с коллегами заказал у компании синтез и тесты, но не сказал, что именно он делает. «За тесты мы заплатили около $200 тысяч, что для нашего партнёра, чей оборот $2 млрд, — копейки», — вспоминает учёный.

Спустя время исследователю позвонили из компании и сказали, что молекулы его команды выглядят странно, а для мишеней, против которых хотят их протестировать, они вряд ли будут работать. Компания посоветовала Insilico Medicine синтезировать что-нибудь другое.

Мы отказались и пояснили, что не делаем молекулы для продажи на рынке, а тестируем новую технологию их генерации.

Наши партнёры сразу заинтересовались: «Мы никогда такого не видели. Можно наши учёные посмотрят, что вы делаете? Потому что мы самые большие эксперты в мире по химии и не думаем, что это будет работать». Мы согласились.

Александр Жаворонков

Когда химики протестировали молекулы и выяснилось, что они работают, компания сразу захотела инвестировать в Insilico Medicine.

По словам основателя, молекулы обычно имеют сходство с теми, которые используются для тренировки нейросетей. Но учёные из его команды придумали новые алгоритмы, которые позволяют сильно разнообразить генерируемые молекулы — они не похожи по структуре на то, что существует в природе или придумано человеком.

В итоге компания учёного вместе с партнёрами (их названия Жаворонков не называет) продолжила эксперименты. В начале 2018 года Insilico Medicine закрыла раунд инвестиций на $6 млн. Дополнительно в финансировании поучаствовали фонды Bold Capital Partners и Pavilion Capital.

Молекула против фиброза

После этого партнёры предложили Insilico Medicine сделать тесты. Это бы помогло им удостовериться, что технология компании работает и может рассматриваться как возможный способ создания молекул для сложных мишеней.

Например, для гена KRAS (протоонкоген, ключевой белок нескольких сигнальных путей) или Myc (фактор транскрипции, также участвует в развитии онкозаболеваний).

Мы хотели показать, что ИИ способен быстрее человека придумать действующие молекулы.

Александр Жаворонков

Жаворонков согласился на эксперимент с условием, что компании не только его проспонсируют, но и разрешат опубликовать научную статью, чтобы поделиться результатами с миром.

«С этим было много проблем. Никто не хотел, чтобы мы публиковались, потому что в итоге мы отдаём идею, и многие учёные из Китая уже начали повторять то, что мы делаем», — рассказывает исследователь.

Тем не менее Insilico Medicine провела эксперимент. В июле 2018 года инвесторы дали исследователям мишени, под которые предстояло разработать молекулы.

По условиям мишени не были такими, над которыми люди бы бились десятки лет, но так и не смогли найти под них соединения — это нужно было для того, чтобы сравнить время работы ИИ с человеком.

Один из экспериментов был по мишени DDR-1 киназы, которая задействована в развитии фиброза и других заболеваний.

Нейросеть Insilico Medicine сгенерировала шесть молекул.

​Молекулы, которые сработали на мишени DDR-1 киназы
​Молекулы, которые сработали на мишени DDR-1 киназы

Соединения протестировали in vitro, в том числе на культуре клеток печени. Четыре молекулы сработали — связались с мишенью и показали положительное воздействие на патологию, а две из них — положительно воздействовали даже при маленькой концентрации.

Молекулы сработали так, как учёные предсказывали, и оказали влияние на мишени. Это означало, что их можно использовать для создания лекарств против фиброза.

После этого Жаворонков и его коллеги подали статью в журнал Nature Biotechnology. Редактор издания сразу согласилась опубликовать материал, но предупредила, что нужно пройти процесс рецензирования другими специалистами. Она послала материал трём рецензентам.

Через полтора месяца пришли рецензии на статью с комментариями. Первые два рецензента, видимо, из области ИИ, сказали, что это должно быть принято для публикации прямо сейчас.

Третий, наверное, из фармацевтики, сказал, что не верит в достоверность полученных данных, один из графиков в исследовании выглядел для него нереалистично. И нам предложили всё переделать.

Александр Жаворонков

Компания приняла эту позицию и повторила все эксперименты, но уже у другого партнёра в Англии (название партнёра Жаворонков называть отказался). Он подтвердил предыдущие результаты.

Однако тот же рецензент посчитал, что сгенерированные ИИ молекулы не будут работать на мышах и добавил, что всё ещё не верит в технологию. Учёным пришлось проводить эксперименты на грызунах.

«Вероятность того, что на них что-то сработает, — ещё ниже, но всё прошло успешно, статью опубликовали», — заключает основатель.

В итоге за 21 день учёные сделали молекулы, которые работают даже на мышах. Ещё 25 дней ушло на синтез и тестирование молекул.

Тогда партнёры компании попросили провести и другие тесты, в том числе под более сложные мишени, ионные каналы (сложные трансмембранные белки, которые помогают клетке обмениваться с окружающей средой ионами). На них технология тоже сработала, но алгоритмы Insilico Medicine не раскрывает.

По словам исследователя, он с командой ожидал, что публикация станет популярной, но что настолько — нет.

Кто-то из медиа сделал новость более сенсационной, чем нам хотелось, и сказал, что мы решаем все проблемы поиска медицинских препаратов и фарминдустрия больше не нужна. Это нехорошо, потому что фармкомпании не воспринимают такую позицию всерьёз.

С другой стороны, есть журналисты, которые пытаются найти негатив. Фармкомпании теперь порою даже ищут таких журналистов, чтобы как-то объяснить своим топ-менеджерам, почему они до сих пор с нами не сотрудничают.

Александр Жаворонков

Как рассказывает основатель, кульминацией стала ежегодная конференция в Базеле по поиску новых препаратов, ИИ и старению. Жаворонков создал это мероприятие и уже шесть лет проводит его с коллегами и партнёрами.

Ежегодно на закрытии конференции выступают руководители крупных фармацевтических компаний Roche или Novartis, главные офисы которых также находятся в Базеле.

Жаворонков вспоминает: «В этом году я находился в другом помещении, когда мне начали присылать сообщения из главного зала, чтобы я быстрее в него вернулся».

Руководитель Novartis показывал слайды из статьи исследователя и рассказывал, что это большой прорыв для фармкомпаний. «Это означает, что нас признали на самом высоком уровне», — резюмирует учёный.

Планы

До выхода статьи, ещё летом 2019 года, Insilico Medicine закрыла раунд инвестиций на $37 млн. Основная доля в компании принадлежит теперь не Жаворонкову, а сразу нескольким инвесторам. Всего их 13.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.crunchbase.com%2Forganization%2Finsilico-medicine%23section-funding-rounds&postId=92646" rel="nofollow noreferrer noopener" target="_blank">​Данные</a> о раундах инвестиций в Insilico Medicine
​Данные о раундах инвестиций в Insilico Medicine

Исследователь рассказывает, что его ближайшие планы — вкладывать деньги в наём сильных менеджеров. Он вырастил компанию и хочет продолжить ею управлять, но ему нужны рядом люди, которые разбираются в фарминдустрии.

«Те, с кем мы раньше боролись, теперь нам очень нужны, чтобы заключать партнёрства с фармкомпаниями и продавать нашу технологию генерации молекул», — комментирует исследователь.

Больше половины суммы при этом пойдёт на разработку внутренних собственных терапевтических препаратов и лицензирование молекул (процесс продажи молекул в фарминдустрии, который включает предоплату, последовательные платежи, и процент с продаж). По словам исследователя, когда молекула работает, уже никого не волнует, как она сделана.

По словам учёного, сейчас Insilico Medicine не приносит прибыль: «У компании гигантские убытки, гораздо больше, чем инвестиций».

Но это нормально. Большинство компаний в биотехнологиях — убыточны. Они делаются не для заработка. Их создают, чтобы вывести потом компании на IPO или продать большой фармацевтической компании.

Александр Жаворонков

Жаворонков и его команда пока не думает о выходе на прибыль, а оценка Insilico Medicine зависит от оборота. Назвать его учёный отказался, но добавил, что в следующем году планирует закрыть сделки на $300 млн. В 2019 году их сумма была примерно $200 млн.

«Вообще, суммы сделок в фарминдустрии мало что значат, потому что компания получает совсем чуть-чуть сразу, а остальные части выплачиваются после каждого этапа клинических испытаний», — уточняет исследователь.

По его словам, молекула путешествует в течение десяти лет по всем ступеням, и только спустя всё это время компания получает сумму, которую анонсировала. Также всегда высок риск провала.

После первой стадии тестов молекулу могут купить за $35–40 млн.

Фармацевтика в России и в мире

Жаворонков вспоминает, когда он с коллегами закрывал последний раунд инвестиций, ему хотелось сотрудничать с российскими инвесторами. Он уговорил партнёров на участие российского представителя, но под самый конец отказался от этой идеи.

«Мне стало очевидно, что инвестор не разбирается в индустрии. Если бы он инвестировал, нам бы пришлось тратить время на объяснение наших решений и действий, а не работу», — поясняет исследователь.

Он рассказывает, что в России продвигает свою область и привлекает учёных, чтобы молодые специалисты не уезжали из страны, а оставались и работали в науке.

По его мнению, ни у одного российского заведения или института нет такой же популярности и прогресса по статьям, как у Insilico Medicine. Компания старается платить русским учёным хорошую зарплату (точную сумму Жаворонков не называет) и давать им возможность публиковать серьёзные научные статьи.

«В Китае у меня такая проблема: взял человека, а через полгода он уже в другой компании, потому что там ему предложили зарплату на $5000 больше. Он тянет туда наши наработки и знания», — комментирует основатель компании.

Он считает, что в России люди лояльнее и понимают, что работодатель для них делает: «Для них ты не просто мешок денег, а нечто большее».

Хорошо, что в России не сильно развита фарминдустрия. У учёных даже здесь есть возможность быть лучшими в генеративной химии.

Александр Жаворонков

Сейчас на полный рабочий день в Insilico Medicine со всего мира работает 86 человек. Также у основателя есть около 80 сотрудников, которые сотрудничают с ним по частично: есть договорённости с Оксфордом и университетом Копенгагена. Там компания поддерживает группы учёных-консультантов, которые проводят для неё часть экспериментов с молекулами.

Одной из проблем в фармакологии Жаворонков считает то, что люди начинают работать в компании, переходят в другую и десять лет не видят результата своей работы, хотя занимают уже руководящие посты.

Вместе с этим специалистам либо не позволяют публиковать свои научные работы, либо разрешают только те, что неважны. «Фарминдустрия — самая консервативная индустрия по анонсам и публикациям», — считает учёный.

По его словам, причина такой скрытности — время. На разработку лекарства уходит 10–15 лет. Если компания потратил пять лет, а потом конкурент узнал молекулярные структуры или молекулярные мишени, он может сильно сократить разрыв в гонке за лидерство.

Кроме того, фармакология — самая саморегулируемая индустрия. Никто не ожидает побед. Все ожидают только провала, потому что о победе можно говорить только в том случае, если препарат выдержал 99% испытаний.

Из нескольких миллионов молекул, которые могут подойти под мишени, на рынке сейчас одобрено менее 2000 препаратов. Лекарств, прошедших испытания, очень мало, а провалов — несколько сотен тысяч.

Александр Жаворонков

При этом официальных заболеваний, как рассказывает учёный, более 30 тысяч, но некоторые из них можно вылечить одним и тем же препаратом.

По его словам, многие виды рака уже побороли, в детской онкологии выживаемость сейчас более 85%, в том числе в России. Он рассказывает, что если вовремя заметить и правильно лечить детей с лейкемией или лимфомой, выживет большинство, хотя сам процесс неприятный и дорогой.

Важно помнить, что любые прорывы в биомедицине, где бы они ни произошли, всё равно будут востребованы и получат полезные PR-дивиденды. Если кто-то сделал препарат от рака в России, его всё равно будут покупать, и плохого никто сказать не сможет.

Если развивать энергетику, автопром, телекоммуникации, это могут обложить санкциями и поливать грязью. Но фармакология — сфера, которую невозможно критиковать.

Мне кажется, эта та индустрия, где все могут объединиться против чего-то одного. Думаю, что именно об этом нужно больше рассказывать в СМИ.

Александр Жаворонков
4040
9 комментариев

Спасибо за интересный обзор проекта! Мы совместно с НМИЦ онкологии им. Н.Н. Блохина занимаемся подобными исследованиями.

1

научили ИИ

Не ИИ.

«Компания старается платить русским учёным хорошую зарплату». Думаю, более корректный термин в таких публикациях - «российским учёным».

А в чем разница?

Классический подход в медицине: воздействовать на следствие приводит к таким вот построениям. Учёные с помощью ИИ ищут пути ускорения поиска молекулы и средств доставки к мишени. Можно ли с помощью алгоритмов ИИ понять что они работают со следствием? Или материалистический подход непреодолим этими средствами?

Потрясающая компания, с абсолютно радикальным подходом который достоин уважения. Сам я всего лишь касался фармы в своей карьере и знаю как там все медленно, а подход за 25 дней - создать молекулу,и протестировать ее - это не просто революция. Это 1000x революция. Всех благ!