Как нейросеть будет отслеживать состояние Байкала
Рассказываем, зачем ученые НИИ биологии ИГУ совместно со специалистами Yandex.Cloud и Maritime AI ищут в водах Байкала микроскопических рачков и как мониторинг может помочь сохранить экосистему озера.
Эндемики как живой фильтр озера
В Байкале жизнь кипит во всей толще вод – и на мелководье, и на глубинах больше 1,5 километров. Это возможно благодаря уникальной насыщенности воды кислородом даже на больших глубинах. 2/3 видов, живущих в озере – эндемики, то есть живые организмы, которые обитают в единственном месте на планете. Среди них байкальская нерпа, омуль, голомянка, пресноводные губки, рачки-амфиподы и рачки-изоподы. Байкал обладает уникальной способностью самоочистки, прежде всего благодаря самым маленьким своим обитателям — фито- и зоопланктону.
Важнейший эндемик озера – веслоногий рачок эпишура, размером всего в 1,5 мм. Он образует до 80% зоопланктона и является живым фильтром озера, пропуская через себя воду и очищая ее. Несмотря на свои микроскопические размеры, каждая эпишура способна профильтровать стакан воды в сутки, а в год очистить 15 м³ воды. Кроме того, им питаются другие обитатели водоема. Количество таких эндемиков - по сути фундамент всей экосистемы Байкала.
Что такое проект «Точка №1»
Отслеживание изменений состояния фито- и зоопланктона - одна из ключевых задач программы мониторинга «Точка №1». Она была запущена в феврале 1945 года известным исследователем озера Байкал профессором Михаилом Кожовым. Кстати, «Точка №1» внесена в Книгу рекордов России как самый длительный проект регулярного экологического мониторинга в истории науки.
В рамках проекта непрерывно ведутся отборы проб планктона и замеры показателей состояния толщи воды, а собранные данные заносятся в единую базу. Реализацией программы занимается НИИ биологии Иркутского Государственного Университета при поддержке Минобрнауки и Фонда “Озеро Байкал”. Уже накоплено более 5 миллионов записей, отражающих еженедельное состояние экосистемы.
Мониторинг толщи воды учитывает несколько параметров. Прежде всего ученые исследует фитопланктон, которым питается зоопланктон, и самих микроскопических рачков. Пробы отбираются с помощью закрывающейся сети Джеди, специального оборудования по ловле планктонов, на глубинах 0-10, 10-25, 25-50, 50-100, 100-150, 150-250 м. Их обрабатывают формалином, отстаивают в течение 7 дней, затем концентрируют в объёме 100-150 мл. После этого в лаборатории ученые с помощью микроскопа вручную исследуют пробы, учитывая количество фитопланктона и зоопланктона, его видовой состав. Это сложная задача, так как существует 774 полных формы рачков: различают разные возрастные группы, самцов и самок.
Затем данные заносятся в карточки, а оттуда – в базу данных. Мониторинг первых звеньев экосистемы Байкала на коротких отрезках времени позволяет увидеть сезонные и погодные колебания, а на основе продолжительного ряда наблюдений становятся ясны закономерности и влияние глобальных экологических процессов на экосистему озера. Кроме того, оценка планктонного сообщества дает важную информацию о состоянии более высоких звеньев пищевых цепочек. Так, уменьшение концентрации эпишуры в пробах свидетельствует о повышении риска для популяции голомянки и омуля, которые ей питаются, а как следствие, и для нерпы.
Также проводятся замеры прозрачности и температуры озера на поверхности и на разных глубинах. Эти параметры позволяют спрогнозировать как поведут себя обитатели озера, например увеличение или уменьшение популяций и появление чужеродных видов.
Зачем биологам ML-алгоритмы и облачная инфраструктура
«Точка №1» существует уже более 75 лет, все эти годы анализ проб производится вручную. Этот процесс трудоемкий и должен выполняться высококвалифицированными токсономистами.
Создание алгоритма классификации проб планктона позволит решить проблемы в развитии системы мониторинга «Точка №1». В первую очередь, это процесс передачи знаний и экспертизы. Сейчас уходят на пенсию специалисты, которые, благодаря десятилетиям работы, обладают уникальными знаниями и опытом в распознавании нескольких сотен видов фито- и зоопланктона, в том числе эндемиков, которые не обитают нигде кроме Байкала. Автоматизированная система распознавания проб станет универсальным ассистентом в определении видов планктона, что позволит любому выпускнику биологической специальности участвовать в проекте.
Подготовка специалиста, способного к идентификации отдельных видов, занимает десятилетия. И такие специалисты - штучный товар. Невозможно, даже имея базовое биологическое образование, прийти и начать сразу идентифицировать 400 видов планктонных организмов. Этому нужно долго учиться.
Также разработанный алгоритм должен значительно увеличить скорость работы команды биологов, так как в год анализируется порядка 5 миллионов проб, а на распознавание у человека уходят десятки секунд, алгоритм же способен сделать это за миллисекунды.
Сейчас пробы берутся в единственной точке на озере, хотя до 90-х годов велись регулярные наблюдения по сети станций вокруг Байкала. Использование облачных технологий позволит масштабировать проект и открывать дополнительные точки мониторинга в будущем, например, в районах массового развития туризма или в окрестностях крупных городов, стоков промышленных производств. При этом точка №1 станет референсной точкой сравнения, поскольку в районе ее расположения антропогенный фактор минимален. Можно будет сравнивать состояние разных районов экосистемы Байкал с «эталонной» системой в районе Точки. Сейчас это очень время- и трудозатратная работа, которую силами специалистов института выполнить попросту невозможно.
В работе над созданием алгоритма принимают участие специалисты НИИ биологии Иркутского государственного университета, разработчики моделей искусственного интеллекта для изучения морских экосистем MaritimeAI, команда облачной платформы Yandex.Cloud и Фонда поддержки прикладных экологических разработок и исследований "Озеро Байкал".
Как будет реализован проект
Реализация проекта проходит в два этапа. На первом команда Maritime AI развернула в облачной среде инфраструктуру, создала бэкенд и пользовательский интерфейс. Пользовательский интерфейс позволяет сотрудникам НИИ биологии ИГУ самостоятельно дообучать алгоритм и контролировать качество его работы.
На втором этапе создаются алгоритмы для автоматического анализа. Сейчас идет активное обучение модели на тестовом датасете. Рабочий набор данных будет пополняться изображениями проб, которые захватываются напрямую с микроскопа. Первый прототип, который сможет самостоятельно в рабочем режиме распознавать несколько видов, будет представлен в июле этого года. Дальнейшее обучение модели для распознавания всех видов зоопланктона займет около года, так как необходимо учесть сезонность жизни зоопланктона. Техническая сложность классификации в том, что на изображениях пробы рачки могут быть боком, друг на друге, может быть видна только часть животного. Также всегда есть вероятность обнаружения экземпляров, которые раньше не встречались в системе, например видов-вселенцев, нехарактерных для экосистемы Байкала.
Несмотря на то, что Байкал является объектом всемирного природного наследия ЮНЕСКО и охраняется федеральным законом, политические, экономические и социальные факторы приводят к масштабным природным последствиям. Они сказываются на качестве и уровне воды, устойчивости прибрежных районов, биоразнообразии.
Так, согласно международному отчету «State of the Climate 2019», который содержит в том числе и данные мониторинга Байкала, озеро характеризуется выраженным трендом повышения поверхностной температуры воды. По мнению ученых НИИ биологии ИГУ это может привести к гибели живущих в нем холодолюбивых видов организмов и массовому распространению нетипичных видов водорослей и животных, которые могут вытеснять эндемичные виды.
В этих условиях мониторинг экосистемы одна из важнейших задач, так как он позволяет наблюдать за долгосрочными тенденциями и планировать меры по улучшению состояния среды на основе накопленных данных, а не предположений. Развитие проекта «Точка №1» может помочь сохранить уникальное, самое глубокое озеро на планете, содержащее 20% мировых запасов озерной пресной воды.
Подписывайтесь на блог Yandex.Cloud, чтобы узнавать еще больше новостей и историй об IT и бизнесе.
Другие истории, которые активно читают наши подписчики: