Искусственный интеллект и медицина: как достичь высокой точности обработки данных?

Рассказываем об использовании искусственного интеллекта в медицине и о том, что нужно, чтобы достичь высокого качества и точности обработки медицинских данных

Для эффективного развития технологий на базе искусственного интеллекта (ИИ) в медицине крайне важна автоматизация сбора данных в медучреждениях, чтобы впоследствии на них можно было обучать алгоритмы. Качество исходных данных для анализа и обучения – это одно из ключевых направлений, которое может открыть путь к созданию dataset по самым разным областям медицинских знаний. Чем больше будет данных, пригодных для обучения, тем быстрее удастся создать алгоритмы искусственного интеллекта в визуализации и диагностике, системы поддержки принятия врачебных решений, системы риск-анализа и многие другие.

Искусственный интеллект (ИИ) активно используется сегодня в различных сферах нашей жизни и отраслях экономики. Сфера здравоохранения не является исключением. Медицинское программное обеспечение на основе алгоритмов ИИ должно работать качественно и точно. Какие данные нужны для создания искусственного интеллекта и как его «научить» их обрабатывать, чтобы он мог выдавать высокие показатели? Об этом мы расскажем в этой статье.

Медицина теснейшим образом связана с большим объемом данных. Каждый день только в одну поликлинику обращаются десятки пациентов разного возраста и пола, с различным набором симптомов и хронических состояний. Многим из них делают одно или несколько видов исследований:

лабораторных (например, общий анализ крови),
инструментальных (электрокардиография),
лучевых (рентген или компьютерная томография).

Все это складывается в огромные наборы разнообразной информации. И если в поликлинике есть какая-либо локальная сеть (медицинская информационная система или МИС), которая позволяет формировать электронную карту пациента, куда подтягиваются все данные осмотров и обследований, то ежемесячные объемы данных могут достигать нескольких терабайт. Чем же эти данные, учитывая, что они разнообразны и не стандартизованы, могут быть полезны?

Потенциальная польза есть. Анализ и обработка большого массива информации о состоянии здоровья способны «проявить» взаимосвязи между разными признаками (например, артериальным давлением и «ветвистостью» сосудистой сети внутри мозга), которые на первый взгляд кажутся не связанными друг с другом. И эти признаки могут прогнозировать то, как быстро будет развиваться та или иная болезнь у определенного человека, как на него подействует то или иное лекарство, а также, как быстро и в каком объеме он восстановится после заболевания. Для анализа таких масштабных объемов как раз и может помочь искусственный интеллект и применение машинного обучения.

Кроме того, эти данные при определенной подготовке и тщательном отборе могут стать «учебником» для искусственного интеллекта, который, обучившись, способен стать помощником врача. Но для того, чтобы добиться максимальной точности его работы, для обучения необходимо предоставить очень качественные и проверенные специалистами данные. В медицине Big Data – это не только большие объёмы информации, но и технологии её хранения, а также аналитические методы обработки.

За 2020 год СберМедИИ провели анализ деперсонализированных данных пациентов, который помог создать базу для таких моделей ИИ, как «КТ Лёгких», «КТ Инсульт», умного помощника врача «ТОП-3», разработанный совместно с Правительством Москвы, и многих других алгоритмов.

<i>Изображение: принцип работы сервиса «КТ Инсульт»</i>

Так, например, модель «КТ Легких» обучена на основании нескольких тысяч исследований, которые суммарно включают более 200 тыс. срезов без патологий и более 190 тыс. срезов с патологией. На такой большой базе обучался алгоритм и сейчас его точность разметки составляет до 90%. Это означает, что разметки искусственного интеллекта на 90% сходятся с теми, что разметили врачи при создании датасетов для тестирования.

<p>Изображение: принцип работы "КТ Легких"</p>

ИИ обучен выявлять патологию четко по контуру, что дает врачам более полную картину области поражения. На этом обучение алгоритма не заканчивается. После установки «КТ Легких» в поликлиники каждый подтвержденный врачами снимок пополняет знания искусственного интеллекта.

<p><i>Изображение: в 2021 году сервис обучился выявлять рак легких на ранних стадиях. Если ИИ замечает новообразование, превышающее пороговое значение в 4 мм, то он выделяет все образования</i></p>

Врач обучается своему ремеслу больше восьми лет официально и далее – всю жизнь. В процессе обучения он разбирает клинические случаи, сдает теоретические и практические экзамены, получает оценки и учится на своих ошибках. Нейросеть тоже нуждается в таком обучении. Но, преследуя эту цель, нельзя «скормить» компьютеру просто весь массив имеющейся информации – он не научится ничему.

Для создания эффективно работающего алгоритма ИИ нужны структурированные и размеченные медицинскими специалистами данные. Это означает, что каждый кусочек информации имеет определенную метку или аннотацию, распознаваемую алгоритмом. После того как алгоритм получает достаточное количество наборов данных и их меток, точность его работы будет оцениваться так же, как и качество знаний, которые демонстрирует студент на экзамене. Эти «экзамены», которые сдает машина, представляют собой ввод заранее размеченных и известных «экзаменаторам» тестовых данных. Это позволяет разработчикам оценить способность алгоритмов давать правильный ответ. Основываясь на результатах тестирования, алгоритм можно видоизменить или обучить его на дополнительном количестве данных.

Основной критерий эффективности работы алгоритма – это качество тех баз обезличенных медицинских данных, на которых он будет обучаться. Под качеством понимается количество информации, содержащейся в dataset (например, 100 или 1000 снимков), ее однородность (например, одинаковая проекция всех рентгенограмм), тип разметки.
Если продолжать пример с использованием ИИ в лучевой диагностике, разметка, которую, делают врачи, может сообщать лишь о наличии патологии на снимке в формате «есть/нет» без указания на конкретное место, а может содержать подробную маркировку патологической находки в виде ее обведения или закрашивания с подсчетом поперечных размеров или объема. Показатели работы алгоритма могут зависеть даже от того, сколько врачей собирали обучающую базу данных и имели ли они при этом доступ к дополнительной клинической информации или нет. Качественные алгоритмы обучены на данных с точной разметкой патологий, объемов повреждения органов. Применение такой маркировки при обучении, позволяет нейросети работать с высокой чувствительностью к изменениям состояния пациента.
Как мы видим, квалитативное обучение алгоритма связано с довольно сложной и трудоемкой подготовительной работой. Даже на этапе сбора информации для обучающего dataset можно столкнуться со сложностями, которые в дальнейшем скажутся на показателях точности нейросети при тестировании. Например, применяя ИИ при КТ легких, важно произвести сбор данных с разных аппаратов, чтобы исключить ошибку интерпретирования диагнозов. Также важно не допускать ошибки и упущения при разметке, в подсчетах статистики.

Высока вероятность, что в будущем медицинские сотрудники все больше будут использовать в работе технологии на базе ИИ. Это в первую очередь будет касаться разного рода визуализации, то есть распознавания медицинских изображений с использованием глубоких нейронных сетей (deep neural networks): рентгенограмм, томограмм, маммограмм, патанатомических срезов, поражений кожи, снимков сетчатки глаза, электрокардиограмм, эндоскопий, выражений лица и показателей жизнедеятельности, выраженных в графиках.

Работа нейросети обязательно должна основываться и сравниваться с оценками врачей, и для этого существует целый набор функций. Истинно-положительными ответами будут те, которые алгоритм дает правильно и с которым врачи согласны. Соответственно, ложноположительными станут ответы, при которых алгоритм скажет о наличии искомой патологии, которой по факту нет. Это сочетание функций будет говорить о чувствительности нейросети.

В случае истинно-отрицательных ответов алгоритм не видит патологию там, где ее действительно нет. А если он не разглядит патологию там, где она есть, и сообщит о норме, то его ответ будет ложноотрицательным. Это сочетание функций охарактеризует специфичность работы нейросети.

Для сопоставления всех этих ответов и обнаружения зависимости между ними используется график, называемый ROC-кривой. Площадь под кривой (AUC) как раз и будет отражать уровень точности работы алгоритма.

Внедрение любой новой технологии требует определенного времени. Применение технологий на базе ИИ в ежедневной работе медицинских специалистов активно развивается. Появившись несколько лет назад, программное обеспечение на основе ИИ для анализа медицинских данных будет все больше помогать в постановке диагноза и избавлять врачей от рутинной медицинской практики.

Искусственный интеллект и медицина: как достичь высокой точности обработки данных?

Откуда получает информацию искусственный интеллект?

Как информация превращается в знание

«Экзамен» для искусственного интеллекта

Врачебный контроль и тестирование

Вывод