INENEX: система объективной оценки качества эндоскопических исследований. Как мы её разработали

В нашей стране активно ведутся разработки, которые объединяют два мира — медицину и технологии. Так, по оценке Национального центра развития искусственного интеллекта, 16% организаций сферы здравоохранения России уже внедряют решения на основе ИИ.

Мы в NLABTEAM помогаем им в этом: обучаем нейросети, которые позволяют вывести качество обследований на новый уровень.

Сейчас у нас в работе масштабный проект — INENEX.

Вместе с врачами Ярославской онкологической больницы мы создаём ML-решение, которое даёт подсказки в ходе проведения колоноскопии. Автоматизирует заполнение медицинских протоколов, позволяя существенно повысить точность обнаружения онкологии на ранней стадии. Подробности — в статье.

В ней разбираем, почему проект критически важен для медицинского сообщества и пациентов во всём мире, а также говорим о целях, процессе и результатах разработки системы распознавания новообразований.

Колоноскопия — это эндоскопическое обследование, не имеющее равноценной альтернативы в качестве ранней диагностики патологий толстого кишечника.

При использовании колоноскопии как метода скрининга КРР происходит снижение уровня заболеваемости на 60—90%.

Например, с обнаружения полипов, доброкачественных образований, начинается предотвращение рака ободочной кишки. Ещё колоноскопия помогает врачу диагностировать воспалительные заболевания кишечника, которые могут развиваться бессимптомно и существенно снижать качество жизни при несвоевременной диагностике и отсутствии лечения.

INENEX: система объективной оценки качества эндоскопических исследований. Как мы её разработали

Однако это не самая комфортная процедура, и пациенты, особенно с неярко-выраженными симптомами заболеваний кишечника, избегают её. Для остальных ситуация усугубляется тем, что проводить процедуру чаще раза в 6 месяцев не рекомендуется: это слишком большой стресс для организма.

Получается, что для врача шанс разглядеть полипы у каждого отдельного пациента есть не чаще, чем раз в полгода. Поэтому ошибки в методике проведения процедуры ведут к высокой вероятности пропуска тяжёлых заболеваний.

От качества обследования напрямую зависит количество положительных прогнозов в лечении онкологии. Если в процессе колоноскопии наличие новообразования будет пропущено, риск развития онкологии увеличится. Интервал в 6 месяцев между процедурами может стать решающим для пациента.
Мы провели большую работу, чтобы помочь врачам добиться максимально возможного качества процедуры колоноскопии и спасти как можно больше жизней. Вместе с коллегами из онкологической больницы решили создать решение, которое бы позволило подсказать врачу на этапе выполнения обследования, успешно ли он следует стандартам. Указывало бы на новообразования и помогало корректно заполнять медицинские протоколы по результатам обследования.

Идея создания решения принадлежит Ярославской областной клинической онкологической больнице.

Мы с большим энтузиазмом приняли участие в реализации этой идеи, поскольку одна из главных целей и фокусных направлений нашей компании — алгоритмизация работы врачей и высвобождение их времени на наиболее важные задачи по работе с пациентами.

Настолько масштабного проекта в сфере медицины у нас ранее не было, и это ещё больше вдохновило ML-инженеров NLABTEAM.

Работа над созданием системы распознавания новообразований INENEX шла при непосредственном участии инициативной группы врачей Ярославской онкологической больницы:

заведующего отделением эндоскопии, к. м. н., Сергея Владимировича Кашина, который является Заслуженным врачом Российской Федерации и возглавляет Эндоскопический учебный центр Университета;

врача-эндоскописта, доктора наук, Дмитрия Вячеславовича Завьялова., главного вдохновителя проекта по созданию системы распознавания новообразований;
врача-эндоскописта Сабины Руслановны Гусейновой, которая внесла большой вклад в развитие проекта.

Врачи-энтузиасты Ярославской онкологической больницы. Слева-направо: Д. В. Завьялов, С. В. Кашин, С. Р. Гусейнова

Разработка велась на базе Ярославской больницы, которая имеет одно из лучших отделений эндоскопии в России. Оно создано по образу и подобию ведущих японских и европейских клиник и оснащено передовым оборудованием.

Врачи этой больницы регулярно внедряют новые методики и технологии, позволяющие совершать прорывы в диагностике и лечении злокачественных заболеваний.

Например, за внедрение метода лечения неоперабельных прежде больных, онкологи Ярославской области удостоились национальной медицинской премии «Призвание 2023», которой награждают лучших врачей России.

Собственные обследования больница также проводит в Эндоскопическом учебном центре Ярославского государственного медицинского университета. ВУЗ обладает широкими возможностями для проведения обследований и апробации разных методов лечения, в том числе на базе современных цифровых решений.

При создании системы INENEX у нас было 4 ключевые задачи:

обеспечить контроль дохождения до купола слепой кишки в ходе обследования;
помочь врачам поддерживать оптимальное время нахождения эндоскопа внутри кишечника;
обучить ML-модель обнаружению новообразований в реальном времени;
автоматизировать контроль качества очистки кишечника перед колоноскопией.

Что примечательно, аналогичное нашей системе INENEX зарубежное решение в момент своего выхода (~2 года назад) позволило выявлять онкологию на ранней стадии в 2 раза чаще по сравнению с ранее используемыми методами. Мы создавали принципиально новый продукт, опираясь на положительный и отрицательный опыт коллег. Отсюда — ещё более высокая точность диагностики и набор дополнительных возможностей.

Более того, международное медицинское сообщество уже оценило INENEX, о чём мы рассказываем подробнее в завершающем разделе данной статьи.

Уникальность системы INENEX и её отличие от комплексных зарубежных решений — в изолированной разработке ML-моделей. Независимость компонентов дала более высокую скорость на этапе первичной проработки решения и повысила достоверность результатов, выдаваемых системой.

При этом для удобства врача все компоненты системы интегрированы в единый интерфейс.

Основной недостаток ранее созданных в мире решений для интеллектуального распознавания новообразований — это их разрозненность. Их функции не объединены в единую систему, которая могла бы отслеживать все показатели качества колоноскопии в одном удобном для врача приложении в режиме реального времени. В нашем же решении INENEX эта проблема устранена.

Теперь обо всём по порядку.

По запросу врачей Ярославской больницы, система должна помогать контролировать, в полной ли мере проведено эндоскопическое обследование. Для этого «цифровой» ассистент в режиме реального времени выдаёт автоматизированное подтверждение достижения купола слепой кишки.

Система INENEX автоматически срабатывает, когда купол слепой кишки попадает в зону осмотра врача-эндоскописта — на интерфейсе загорается «индикатор уверенности». Этот сигнал даёт понять, что во время обследования не упущен ни один отрезок кишки. Когда процедура выполнена качественно, врач может быть уверен в своих выводах и поставленном диагнозе.

Решение этой задачи кардинально повлияло на качество обследования, и мы считаем её самой важной из всех работ по проекту.
Кирилл Левин, CEO NLABTEAM

Обучение нейросети шло поэтапно. При создании базовой ML-модели была выбрана архитектура «кодер-декодер», поскольку одним из узких мест было отсутствие помеченных данных. Эта архитектура способна изучать функции на основе большого объёма немаркированных данных.

Обучение проводилось на наборе данных Hyper Kvasir, а также на скриншотах из Ярославской областной клинической онкологической больницы (более 1000 изображений). Каждый скриншот был промаркирован и содержал следующие сведения:

протокол;
наименование файлов;
название оборудования, на котором выполнено обследование;
обезличенный идентификатор пациента;
справочная информация.

Также изображения были разделены на два класса: «слепая кишка» и «не слепая кишка». На финальном этапе база для обучения детектора слепой кишки составила более 650 000 единиц контента.

В процессе тестирования обнаружили невысокую надёжность системы, и тогда стартовал второй этап — точная настройка ML-модели. Эксперты использовали дополнительно базу кадров видеозаписей, на которых присутствовал купол слепой кишки в разных ракурсах. В дальнейшем такая вариативность позволила создать более точную классификацию.

Итерационный подход к обучению ML-моделей — стандартная практика для опытных разработчиков. На каждом этапе подрядчик тестирует модель в реальных условиях, делится промежуточными результатами с заказчиком и на основе обратной связи оперативно вносит корректировки, пошагово улучшая продукт. Таким образом, ожидания заказчика будут соответствовать реальности, и инвестиции не пропадут даром. Если же подрядчик не взаимодействует с заказчиком, не тестирует регулярно свежие версии и не запрашивает на них отзывы, то это может быть показателем недостаточности опыта и компетенций, и заказчик может не окупить проект.
Кирилл Левин, CEO NLABTEAM

Большое внимание мы уделили вопросам производительности системы, потому что определять «купол» или «не купол» нужно в режиме реального времени, чтобы врач точно довёл текущее обследование до конца. Те классификаторы, которые были введены на старте, работали существенно медленнее и могли обработать только каждый десятый кадр.

Для повышения скорости приняли решение уйти от работы с цветными изображениями и перешли в градации серого, а также оптимизировали ML-модель по количеству нейронов и слоёв, чтобы обеспечить быстродействие решения.

Так, мы повысили скорость работы в 2 раза. Сейчас система обрабатывает каждый второй кадр, при скорости 60 кадров в секунду это практически незаметно для человека, при этом каждый фрагмент кишечника получается рассмотреть достаточно чётко.

Переход в монохром был обусловлен также тем, что в какой-то момент нейросеть стала излишне реагировать на цветовые особенности изображения, что приводило к большому количеству ложноположительных результатов.

В результате перехода на монохромные изображения точность определения достижения слепой кишки достигла 97%.

На сегодняшний день система вышла на этап клинической апробации и уже применяется в практике врачей-эндоскопистов Ярославской онкологической клиники. Решение представляет собой мобильный блок, который подключается к любому эндоскопическому оборудованию лечебного учреждения. В отличие от западных аналогов, система универсальна и может работать с оборудованием от разных производителей.

Искусственный интеллект может помочь объективно фиксировать все ключевые показатели, одним из которых в колоноскопии является длительность осмотра всех отделов толстой кишки с целью визуализации полипов.

Рекомендуемое время выведения эндоскопической трубки из купола слепой кишки до анального канала, затраченное на скрининговые или диагностические обследования — не менее 6–10 минут. Этот показатель напрямую связан с показателями выявления полипов и аденом.

В настоящее время задача по контролю времени выведения колоноскопа представляется несложной, врач самостоятельно может отслеживать данный показатель, например, с помощью секундомера. Поэтому развитие системы в данном направлении пока отложено.

Основная ценность колоноскопии для профилактики КРР состоит в возможности выявления предраковых поражений на стенках кишечника. При этом, по статистике, до 28% колоректальных полипов пропускают во время колоноскопии.

При проведении колоноскопии врач-эндоскопист может не заметить полип по разным причинам, это могут быть недостаточное очищение кишечника или временная потеря концентрации. Например, существует такое явление как one and done, когда врач находит одно образование с эндоскопическими признаками аденомы и перестаёт внимательно осматривать оставшиеся участки слизистой оболочки толстой кишки.

Для того чтобы процедура проходила максимально эффективно и количество пропущенных новообразований, даже самых маленьких по размеру, сокращалось, мы обучили нейросеть автоматически детектировать полипы. Предложили экономящий время вспомогательный алгоритм, который позволяет врачу быстро и точно отметить все новообразования в протоколе.

Наша система также срабатывает в случае попадания полипа в область осмотра и ярко подсвечивает зону расположения образования, акцентируя внимание врача. Крупнейшее исследование 2022 года, проведенное европейскими учеными, подтвердило двукратное снижение частоты пропуска колоректальной неоплазии благодаря применению аналогичного решения на базе ИИ в процессе диагностики полипов.

К обучению ML-модели подходили как к задаче обнаружения, где модель предсказывает координаты полипа на изображении и вероятность того, что был обнаружен именно полип. В основе архитектуры был выбран алгоритм обнаружения распознавания объектов SSDLite, поскольку он обладает оптимальным соотношением качества и эффективности. Обучение проводилось с использованием набора данных Hyper-Kvasir.

Одна из сложностей, возникших во время обучения, заключалась в том, что модель часто путала большие плоские объекты на изображении (например, пузырьки) с полипами. Чтобы устранить это препятствие, эксперты рассчитали статистику размеров полипов в обучающем наборе и проигнорировали прогнозы модели, которые имели слишком большой размер.

В результате количество ложных срабатываний значительно снизилось, точность обнаружения составила 97%.

На данном этапе система может определить наличие полипа. В дальнейшем планируется развитие решения. Новый функционал по подсчёту и определению морфологии новообразований сможет заменить биопсию и сократит для пациента количество тяжёлых процедур колоноскопии. Такой подход гарантирует высочайшее в мире качество обследования с первого раза и увеличит качество диагностики КРР.

Европейское и Американское общества гастроинтестинальной эндоскопии (ESGE и ASGE) выделяют подготовку кишечника в качестве приоритетного индикатора успешной колоноскопии. Её качество обеспечивает возможность интубации слепой кишки, детального осмотра слизистой оболочки и выявление даже минимальных патологических изменений.

Однако в России не существует чёткого регулирования процедур по оценке качества очистки кишечника, единые правила и скрининговые программы отсутствуют. Такой подход препятствует внедрению автоматических методов оценки.

Критерии оценки этого параметра слишком субъективны, и мы с врачами сейчас работаем над тем, чтобы исправить это — создаём объективную шкалу оценки качества очистки кишечника. Цель работы — помочь врачу оценивать степень очистки и процент визуализированной площади толстой кишки.

Расскажем, каких результатов достигла проектная команда на сегодня.

Для обучения ML-модели мы использовали базу данных Hyper Kvasir и ориентировались на Бостонскую шкалу подготовки кишечника (BBPS).

Hyper Kvasir — это открытая база данных из более чем 10 000 изображений и видеоконтента, собранных с помощью эндоскопического оборудования. Данные собираются во время реальных гастро- и колоноскопических обследований в больнице в Норвегии и частично маркируются опытными врачами-эндоскопистами.
Бостонская шкала подготовки кишечника — это количественная 4-балльная система оценки подготовки, она проводится по трём сегментам: правые отделы толстого кишечника (слепая и восходящая ободочная кишка), средние отделы (поперечно-ободочная кишка, включая печеночный и селезеночный изгибы) и левые отделы (нисходящая и сигмовидная ободочная кишка, прямая кишка).

Каждому из трёх отделов выставляется оценка от 0 до 3 баллов:

Общее количество баллов суммируется, и максимальное их количество, соответствующее идеальному качеству подготовки, в сумме составляет 9. Адекватной считается подготовка с общей суммой баллов 6 и/или при условии, что общая сумма баллов по каждому сегменту >2.

На одном из этапов обучения ML-модели мы столкнулись с двумя предсказуемыми сложностями:

Во-первых, при наличии даже незначительных остатков содержимого в кишке система выдавала большое количество ложных срабатываний.

Во-вторых, при отборе маркеров стало очевидно, что оценка качества очищения кишечника даже в малейшей степени не является стандартизированной процедурой. Некоторые практикующие эндоскописты для характеристики уровня подготовки кишечника перед колоноскопией используют такие термины, как «адекватная» и «неадекватная» подготовка. Другие специалисты применяют различные оценочные шкалы, например Бостон (Boston Bowel Preparation Scale) или Оттава (Ottawa Bowel Preparation Scale).

Поскольку нельзя совершенствовать ML-модель без чётких и общих для всех критериев успеха со стороны медицинского сообщества, совместно с врачами больницы мы приняли решение сфокусироваться на других задачах проекта: развитии систем для автоматизации контроля достижения купола слепой кишки и определения новообразований.

Обучение ML-моделей заняло 6 месяцев интенсивной работы и велось по Agile. Мы действовали итерационно, по недельным спринтам. На рабочую неделю впёред планировались задачи, систематически велась сверка промежуточных результатов с врачами клиники и демонстрация прогресса.

С нашей стороны в разработке приняли участие:

руководитель ML-проектов;
ML-инженер;
2 разработчика интерфейса;
инженер, привлечённый для сборки стенда и интеграции нашего ML-решения с медицинским оборудованием;
QA-инженер;
DevOps-инженер.

В ходе проекта команда тестировала систему для подтверждения её работоспособности и поиска точек развития. Например, в целях проверки способности нейронных сетей выявлять полипы и купол слепой кишки, было проведено экспериментальное обследование реальных пациентов Ярославской онкологической больницы.

Врачи оценивали не только точность, но также удобство приложения. Так, в процессе тестирования первой версии интерфейса, мы собрали обратную связь и пришли к выводу, что не все подсказки, которые были внедрены, информативны для врача. После этого интерфейс был оперативно доработан и дополнен информацией для повышения степени уверенности при диагностировании.

Кроме того, наши разработчики сделали так, чтобы рамка-индикатор, которая отмечает, например, полип, задерживалась на экране на несколько секунд — и врач успевал увидеть зафиксированный объект.

Видеосъёмка эндоскопом ведётся с частотой 60 кадров в секунду, и если полип детектирован, к примеру, только на двух кадрах из 60, то рамка будет светиться всего доли секунды. Для врача такое видео превращается в бесконечное мелькание, и полип может быть потерян из виду.

Чтобы исправить ситуацию, команда применила алгоритмы сглаживания и интерполирования, и в итоге подсветка полипов и подсветка детектированного купола слепой кишки стали более плавными и комфортными для врачей.

Высокая оценка от заказчиков системы INENEX и внимание к решению со стороны медицинского сообщества подтверждает важность внедрения разработок на базе ИИ в процесс диагностики таких серьёзных заболеваний, как рак.

Профессор Наталья Евгеньевна Мантурова, пластический хирург Министерства здравоохранения РФ, д. м. н., активно популяризирует применение технологий на базе ML в медицинской практике, и рассказала про INENEX слушателям крупнейшего Конгресса для пластических хирургов.

Кирилл Левин, CEO NLABTEAM, руководитель и главный эксперт проекта, к. т. н., а также Марина Фролова, ML-инженер, представили доклад о создании детектора полипов и детектора купола слепой кишки на Международной конференции APAN.

В ближайшей перспективе решение будет дополнено функцией автоматизации заполнения протоколов по итогам проведённой колоноскопии. Это важное направление, ведь ключевая задача любого цифрового инструмента — это оптимизация времени, которое тратит специалист на выполнение той или иной задачи. В рамках обучения ML-модели для автоматической генерации отчётов, планируется внедрить голосовое управление, диктовку протоколов обследования и автоподсчет обнаруженных полипов.

Для того чтобы завершить работу и создать систему, которая принесёт максимальную пользу врачу и избавит от рутинной работы по ведению документации, безусловно, требуются инвестиции.

После доработки, на которую нужно от 4 до 6 месяцев, систему повсеместно начнут внедрять в диагностическую практику Ярославской онкологической больницы, а затем масштабировать и на другие лечебные учреждения в стране — и мы будем в этом помогать.

Как отмечали выше, в настоящее время мы и команда С. В. Кашина совместно работаем над созданием методологии формализованной оценки качества очищения кишечника. Внедрение стандартов в будущем позволит реализовать задачу по автоматизации контроля качества данной процедуры.

Основная сложность, с которой команда сталкивается в процессе работ — это отсутствие достаточных маркированных данных. Дальнейшее развитие системы будет включать сбор большого объёма данных для обучения и повышения скорости и точности нейронных сетей, а также маркировку набора данных для классификации слепой кишки, аналогичную индикации при обнаружении полипов, т. е. подсвечивании целевых зон световыми рамками.

🩵 КОМАНДА NLABTEAM БЛАГОДАРИТ ВСЕХ ВРАЧЕЙ И ТЕХНИЧЕСКИХ СПЕЦИАЛИСТОВ, ПРИЧАСТНЫХ К РАЗРАБОТКЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ОБНАРУЖЕНИЯ НОВООБРАЗОВАНИЙ INENEX.

INENEX: система объективной оценки качества эндоскопических исследований. Как мы её разработали

Большая цель проекта — помочь врачам повысить точность обследования кишечника, а людям с онкологией — жить дольше

В ходе обучения ML-модели активно помогали врачи

Решение тестировали в одном из лучших в стране отделении эндоскопии

В фокусе — решение задач по повышению качества обследования на каждом этапе его проведения

Задача 1. Контроль дохождения до купола слепой кишки

Задача 2. Контроль времени выведения эндоскопа

Задача 3. Обнаружение новообразований

Задача 4. Контроль качества очистки кишечника перед обследованием

Мы выстроили процесс работы по Agile и последовательно совершенствовали решение

Проект привлёк интерес медицинского сообщества в разных странах мира

Перспективы развития проекта уже известны