Искусственный интеллект в биотехе

Сегодня искусственный интеллект (Artificial intelligence, AI) широко используется в науках о жизни: рациональный драг-дизайн, функциональная и структурная геномика и прочие омики, анализ медицинских изображений, предсказание третичной структуры белков и многое другое.

Искусственный интеллект в биотехе

История ИИ

Принято считать, что сама область искусственного интеллекта зародилась в 1943 году, когда впервые была предложена математическая модель искусственного нейрона. А в 1956 году во время конференции в Дартмутском колледже Джон Маккарти предложил уже сам термин ИИ, введя его в академический оборот. В дальнейшем сфера претерпела несколько периодов бурного развития и полного застоя.

Искусственный интеллект в биотехе

Окончательное возрождение искусственного интеллекта произошло в десятые годы XXI в., когда алгоритмы машинного обучения вошли без преувеличения в каждый дом: тут можно вспомнить системы распознавания лиц, обработки речи (Alexa, Siri), потребительских прогнозов (Netflix), машинного перевода (Google Переводчик). С тех пор сфера только развивается: лучшее подтверждение — нашумевший ChatGPT.

Искусственный интеллект, машинное и глубокое обучение

Обыватели часто смешивают понятия искусственный интеллект, машинное и глубокое обучение, оперируя ими как синонимами. Но на самом деле эти термины самостоятельны, хотя и вложены друг в друга по принципу матрешки.

Искусственный интеллект в биотехе

Наиболее широко трактуется искусственный интеллект (ИИ, или AI). Под ним подразумеваются интеллектуальные системы, которые могут выполнять задачи, требующие творческого начала. Но пока машины не достигли уровня человеческого разума, и многие специалисты полушутя расшифровывают аббревиатуру ИИ как «имитация интеллекта».

Машинное обучение (Machine learning, ML) — одно из направлений ИИ, когда компьютеры могут сами распознавать шаблоны, находить закономерности в массивах данных и делать прогнозы. Яркий пример того, что ИИ не всегда тоже самое, что машинное обучение, — шахматы. В 1997 году действующий чемпион мира Гарри Каспаров потерпел поражение от IBM Deep Blue — ИИ, но без всякого машинного обучения.

Подобласть машинного обучения — глубокое обучение (Deep learning, DL). Это искусственные нейронные сети. Такие системы повторяют работу нейронов коры головного мозга, когда есть много слоев, и каждый слой получает переработанную информацию от предыдущего. Для глубокого обучения нужно гораздо больше данных, чем просто машинному обучению.

Далее поговорим о том, где ИИ нашел себя в биотехе. И начнем с растениеводства, где искусственный интеллект, по мнению специалистов, может решить проблему продовольственной безопасности. Потом рассмотрим лесное хозяйство и животноводство. А на закуску оставим, пожалуй, самое воодушевляющее направление — медицину.

Мониторинг состояния растений

В агротехе широко применимы алгоритмы компьютерного зрения (CV) на основе сверточных нейронных сетей (CNN). Компьютерное зрение может обнаруживать, автоматически идентифицировать и классифицировать объекты на изображениях, получаемых, например, с камер дронов. Как это работает?

Беспилотные летательные аппараты (БПЛА) облетают плантации по заданным маршрутам и осуществляют аэрофотосъемку, а ИИ анализирует и интерпретирует полученную информацию. Этот подход дает возможность удаленно мониторить состояние посевов, производить более точное прогнозирование урожайности, а также обнаруживать недостаток удобрений или наличие заболеваний и вредителей у сельскохозяйственных культур на огромных территориях.

А наземные роботы, «напичканные» датчиками, могут легко обнаружить сорняки и использовать ИИ для умного опрыскивания и прополки. Камера, установленная на машине-опрыскивателе, при детектировании сорного растения записывает его геолокацию, анализирует размеры и цвет, чтобы произвести расчет и внести точное количество гербицидов, необходимое для его уничтожения. Это позволяет сократить использование химикатов и сэкономить время.

Искусственный интеллект в биотехе

Компьютерное зрение с высокой точностью определяет зрелость плодов и сроки их уборки. Уже созданы роботы c множеством датчиков и искусственным интеллектом, которые перемешаются по теплице. Проанализировав положение плодов в пространстве и степень их поспевания, машины осуществляют захват фруктов или овощей, а потом и сортировку. Роботизированные сборщики урожая смогут решить трудовую проблему, особенно ярко проявившуюся во время пандемии, когда фермеры столкнулись с острой нехваткой рабочей силы.

Высокопроизводительное фенотипирование в селекции

Искусственный интеллект в биотехе

«Как соотносятся генотип и фенотип?» — одна из краеугольных проблем современной селекции растений. Традиционные инструменты фенотипирования основывались на ручном измерении отдельных фенотипических признаков небольшой выборки растений на определенных стадиях онтогенеза, что давало лишь ограниченную информацию и к тому же заставляло повреждать побеги.

Сегодня широкое распространение получило высокопроизводительное фенотипирование (High-throughput phenotyping, HTP), обеспечивающее цифровой автоматизированный анализ гигантских выборок растений для массовых селекционно-генетических экспериментов. HTP подразумевает оценку сразу множества признаков от клеточного уровня вплоть до целых растительных сообществ. Метод позволяет найти закономерности между морфологическими, химическими и физиологическими свойствами тысяч растений и условиями среды.

Сбором данных при HTP занимаются беспилотные летательные аппаратами в сочетании с алгоритмами компьютерного зрения, а также наземные роботы, оснащенные несколькими датчиками и неинвазивными сенсорами, которые могут делать замеры на всем участке несколько раз в день или в течение всего сезона от всходов до созревания. Это приводит к огромному количеству пространственных и временных данных для анализа и хранения, эффективно разобраться с которыми помогает также машинное обучение.

Объединение результатов фенотипирования на основе изображений и информации с полевых датчиков с геномными и прочими омиксными данными о реакциях растений на условия среды (экспрессия генов, биосинтез метаболитов и т.д.) позволяет оптимизировать селекционный процесс и выявить новые фенотипы сельхозкультур, которые более эффективно используют ресурсы и устойчивы к меняющимся климатическим условиям.

Искусственный интеллект в биотехе

Культура клеток растений in vitro

Чтобы быстро размножить растения в промышленных масштабах применяется биотехнологический метод — микроклональное размножение.

Искусственный интеллект в биотехе

Здесь очень сложной задачей является подбор сред для культивирования тканей растений, поскольку нужно учесть множество факторов и их взаимодействие (фитогормоны, макро- и микроэлементы, витамины, аминокислоты). Модели ИИ могут имитировать и прогнозировать рост и развитие тканей растений in vitro в различных условиях для оптимизации питательных сред.

Животноводство

Животноводство — важный сектор сельского хозяйства и крупнейший в мире землепользователь. Чтобы поддерживать его рентабельность без вреда окружающей среде, отрасль должна производить больше с использованием меньшего количества ресурсов и вдобавок сокращать отходы.

Искусственный интеллект в биотехе

Для интенсификации применяется LCA (Life-cycle assessment) — оценка жизненного цикла продукта. Это инструмент, позволяющий измерить экологический след на протяжении всех стадий от фермы до вилки: выращивание культур для производства кормов, здоровье животных, транспортировка, обработка и хранение пищевых продуктов.

Мониторинг создает большие данные, которые можно анализировать с помощью ИИ, чтобы переходить к более замкнутым циклам (за счет сокращения затрат и экономии ресурсов) и снижению выбросов парниковых газов.

Лесное хозяйство

Леса имеют планетарное экологическое значение, а древесина активно используется в хозяйстве. Однако возобновление не поспевает за обезлесением. Искусственный интеллект используется для анализа данных спутниковых снимков, фото с дронов и информации с наземных датчиков, чтобы прогнозировать рост и урожайность деревьев, а также места возгораний.

Искусственный интеллект в биотехе

В 2019-20 гг. Австралию охватила волна лесных пожаров, нанесших серьезный ущерб экосистемам: выгорело 190 тыс. кв. км леса на сумму более 20 млрд долларов. Оперативно была создана система Vesta Mark 2, которая объединяет исторические справки о пожарах за последние 40 лет, данные о состоянии лесного покрова и наиболее уязвимых местах возгораний с прогнозами погоды. На основе этой информации модель прогнозирует потенциальные очаги и скорость распространения пожара и шлет уведомления лесничим, чтобы они были готовы быстро выехать и потушить пламя.

Медтех

ИИ в медицине — популярное и динамично развивающееся направление, ведь оно напрямую касается здоровья человека. За годы работы медучреждений накапливается множество числовых и текстовых данных, например, результаты биохимических анализов, истории болезней или рентгеновские снимки пациентов. Алгоритмы могут анализировать эти массивы и находить скрытые закономерности, которые человек попросту не замечает.

Искусственный интеллект в биотехе

Особенно поражает воображение применение нейросетей для анализа медицинских изображений. Теперь, например, по обычной фотографии покровов тела, сделанной на смартфон, специальные мобильные приложения могут определять рак кожи без проведения биопсии и способствовать ранней диагностике заболевания. Недавно была создана модель ИИ, которая анализирует компьютерные томографии легких и может отличать раковые узлы от доброкачественных образований, что значительно упрощает работу врачам при постановке диагнозов.

Еще ИИ можно использовать для анализа данных из различных источников, таких как электронные медицинские карты и носимые устройства, для выявления закономерностей и корреляций, которые могут указывать на наличие определенной патологии или риск ее развития.

Искусственный интеллект в биотехе

Еще одна сфера: RnD лекарств. Разработка нового фармпрепарата — чрезвычайно длительный и дорогостоящий процесс, о чем мы недавно писали в статье. Однако отдельные его этапы можно ускорить с помощью ИИ, например, предсказание терапевтических мишеней. Использование нейросетей для интеграции разнообразных омиксных данных позволяет составить лучшее понимание механизмов болезней и определить потенциальные лекмишени.

ИИ пригоден и для рационального драг дизайна in silico. Химические библиотеки сегодня содержат миллиарды молекул, поэтому необходимы максимально эффективные подходы к виртуальному тестированию. Методы компьютерного обнаружения лекарств (CADD) способны значительно ускорить темпы скрининга новых препаратов. Например, платформа Deep Docking проводит экономичный молекулярный докинг и обеспечивает ускорение скрининга с помощью QSAR-модели в 50-100 раз. Это достигается за счет предварительного отбрасывания плохо «стыкуемых» молекул и окончательного докинга только ограниченного подмножества лигандов с наивысшими рангом. О современных подходах в медицинской химии можно послушать в лекции Яна Иваненкова.

Искусственный интеллект в биотехе

Еще больше о применении ИИ в медтехе, а также стартапах, которые активно развиваются в этой области, можно узнать из лекции Анны Костиковой, которую она прочитала в рамках курса «Биотех глазами инвесторов». Запись находится в открытом доступе на нашем ютуб-канале.

Заключение

Таким образом, бум машинного обучения и нейросетей в нашем тысячелетии стал возможен благодаря доступности огромного количества данных, совершенствованию технологий их хранения, повсеместной цифровизации и все более высоким вычислительным мощностям. Сегодня буквально каждый день появляются новости об очередных достижениях в сфере искусственного интеллекта. Надеемся, что и в биотехе ИИ будет только процветать.

Бластим предлагает вместе знакомиться с ИИ. Начните в мае осваивать питон, а уже в конце лета приходите на продвинутый курс по ML. Так вы сможете быстрее выйти из зоны черного круга на диаграмме в начале нашей статьи в сторону тех, кто использует, исследует и разрабатывает ИИ! Успехов!

44
1 комментарий

Но опять же, ИИ это не сто процентов правильный ответ/совет, он еще часто ошибается

1