Подкаст: кто такие биоинформатики и что они изучают
В новый выпуск подкаста «Сушите вёсла» зашёл руководитель научной группы Института биоинформатики Юрий Барбитов. Обсудили профессию биоинформатика и всё вокруг неё: чем похожа на Data Science, почему полезна для человечества и как продвигает науку. Запись выпуска внутри статьи.
«Сушите вёсла» — подкаст про разработку, аналитику, тестирование и всё, что связано с созданием IT-продуктов. Его ведут разработчики red_mad_robot Артём Кулаков и Рома Чорыев. В эпизоде #16 обсудили, что происходит, когда информатика пересекается с биологией, и Юрий Барбитов попробовал объяснить нам простыми словами про геном, секвенирование и «мокрых биологов».
Ниже подкаст и ответы на несколько горячих вопросов про биоинформатику.
Тайминг
1:50 — как попасть в биоинформатику;
- 4:30 — что такое биоинформатика;
10:20 — чем похожа на Data Science;
- 17:02 — секвенатор и секвенирование;
23:35 — как развивается биоинформатика и почему она важна;
- 29:30 — риски в работе с данными и в лабораториях;
- 35:17 — стоимость биоинформатических исследований;
40:00 — про платформы Folding at Home, World Community Grid;
- 50:25 — проблема с массивами данных в биоинформатике;
- 55:15 — в каком состоянии находится биоинформатический софт;
- 1:00:50 — где хранятся данные;
1:05:09 — проблемы с хранилищами данных;
- 1:15:00 — как обучиться на биоинформатика.
Что такое биоинформатика
Юрий считает, что у каждого специалиста своё представление о том, что это за область науки. Но герою выпуска ближе такое определение — биоинформатики придумывают, как обрабатывать большие массивы биологических данных, чтобы получить из них конкретные научные результаты.
Эта дисциплина немного похожа на эксперименты в биологии, когда учёный в лаборатории проводит опыты, занимается исследованиями и получает результаты. По словам Юрия, его коллеги называют это «мокрой биологией».
С какими данными работает биоинформатик
Впервые биоинформатику применили, когда люди начали заниматься геномом — это набор молекул ДНК с наследственной информацией. Геном есть у всех живых существ — от бактерий до людей. Если прочитать его и узнать всё про наследственную информацию, человечество научится исправлять наследственные ошибки, подбирать новые методы терапии и т.д.
Проблема в том, что наследственная информация очень большая — это очень длинный текст. Геном человека состоит из трёх миллиардов символов. Чтобы с ним правильно работать, его нужно для начала расшифровать.
В основе расшифровки генома — метод секвенирования. Это прочитывание, восстановление последовательности. Биолог берёт длинную цепочку символов генома и «разрезает» на небольшие кусочки. Затем использует секвенаторы (молекулярно-биологические приборы) — они помогают реконструировать последовательность символов в каждом кусочке. Секвенатор выдаёт набор прочитанных последовательностей — они и станут исходными данными для биоинформатики.
Кто попадает в биоинформатику — биологи или айтишники
Это наука на стыке двух областей — биологии и информатики. Поэтому в неё приходят программисты и биологи. Наш гость пришёл со стороны биологии. Поступил в СПбГУ на биофак, работал на кафедре, специализировался на генетике. Параллельно слушал онлайн-курсы по программированию, а потом узнал про биоинформатику.
Почему недостаточно описательной биологии и где искать лекарство от рака
По словам Юрия, биоинформатика развивается очень активно, потому что для биологии и медицины уже недостаточно описательных исследований. Нужно проанализировать всё то, что человечество открыло за это время.
Исследования в биоинформатики — это дорого?
Необязательно. Прочитать геном одного человека стоит около тысячи долларов. Современные приборы позволяют читать геномы нескольких десятков человек. Но биоинформатика — это довольно хрупкая наука. Если «мокрый биолог» допустил ошибку в лаборатории или реагент изначально оказался некачественным, всё исследование нужно будет проводить заново. Из-за этого увеличится и бюджет, конечно же.
О проблемах в профессии
№1 — колоссальные объёмы данных. Один прочитанный геном человека — это 100 гигабайт данных. Представьте, что вам нужно секвенировать сотни геномов.
№2 — биоинформатический софт. Некоторые часто используемые программы активно разрабатывают и улучшают, но они заточены под стандартные задачи.
Как обучиться на биоинформатика и где искать работу
Юрий подробно рассказал, чему обучаться, чтобы попасть в биоинформатику. Послушайте, начиная с 1:15:00. Если вкратце — обучение недорогое, но долгое. Предложений на рынке мало, но на крутых спецов спрос всегда есть. Нужно самому искать проекты и задачи, предлагать помощь и обрастать контактами.
Полезные материалы
- Сайт Института биоинформатики и годовая программа,
- Лекции Института биоинформатики,
- Онлайн-курсы на Stepik (для тех, кто не имеет бэкграунда в биологии):Молекулярная биология и генетика,Молекулярная биология клетки,Основы статистики,Введение в NGS. Часть 1.
- Книга про алгоритмы в биоинформатике (автор — Павел Певзнер, один из пионеров биоинформатики),
- Rosalind — как leetcode/hackerrank, только для биоинформатиков,
- Как устроены биологические исследования,
- «Прощание с биоинформатикой» — гневный материал человека, которому в биоинформатике не понравилось.
Предыдущий выпуск подкаста «Сушите вёсла»
«Закон есть закон»: как жить в юридическом мире, если ты из айти.
Слушайте нас там, где удобно — SoundCloud, Apple, Google Podcasts, Яндекс.Музыка. Заходите обсудить выпуск в Telegram-чат.