Обратная связь пользователей и работа с ней при разработке искусственного интеллекта в медицине

Обратная связь пользователей и работа с ней при разработке искусственного интеллекта в медицине

Разработка медицинских сервисов на базе технологий искусственного интеллекта (ИИ) – не самая тривиальная задача. Это связано не только с тем, что эта сфера разработки зародилась относительно недавно, но и с самой её спецификой: медицинский домен неспроста считается одним из самых сложных. Консервативность медицинского сообщества оправдана, ведь речь здесь идёт о жизни и здоровье пациентов. Поэтому постоянная коммуникация с врачами и экспертами становится очень важной рутиной для каждого ответственного разработчика медицинского ИИ.

Мы больше больше пяти лет разрабатываем ИИ-решения для помощи специалистам лучевой диагностики. В этой статье расскажем, какие виды обратной связи мы получаем от врачей в ходе работы и для чего её используем.

Обратная связь при обучении модели медицинского ИИ

Больше всего обратной связи от врачей мы получаем непосредственно при разработке системы. В первую очередь, для обучения модели нам нужны медицинские данные с разметкой на объекты, выполненной врачами-рентгенологами. Благодаря этому нейросеть учится выявлять на медицинских изображениях паттерны и признаки, характерные для различных объектов – будь то лимфоузел или злокачественное новообразование.

Но если при разработке ИИ-системы мы будем запрашивать мнение лишь одного врача, мы получим только субъективные данные – а мнение относительно одного и того же исследования у врачей может сильно разниться. К тому же, в практике нам регулярно попадаются довольно неоднозначные, даже противоречивые случаи.

Чтобы данные, которые мы используем для обучения нейросети, были максимально объективными, мы создаём что-то вроде виртуального консилиума, где врачи могут обменяться своими мнениями относительно того или иного вопроса и узнать мнение своих коллег. Обычно в ходе таких обсуждений с врачами мы приходим к общему консенсусу.

Обратная связь пользователей и работа с ней при разработке искусственного интеллекта в медицине

Кроме того, для каждого направления диагностики, в котором мы работаем (маммография, флюорография, КТ органов грудной клетки, КТ головного мозга), у нас есть отдельный врач-консультант. Это более опытный врач, который проверяет разметку данных за другими врачами – поскольку мы, разработчики, не обладаем медицинскими знаниями и клиническим опытом. Консультант помогает составлять инструкции для врачей, которые занимаются разметкой, разрешает конфликты в оценке исследований и консультирует ML-специалистов. Подробнее об их работе и вообще о роли врачей в нашей команде мы рассказали в этой статье.

Обратная связь от пользователей

Ещё один важный пул обратной связи мы получаем от врачей, которые являются непосредственными пользователями наших решений. Например, в Москве (в рамках эксперимента Департамента здравоохранения) решения Цельс применяются более чем в 100 медучреждениях. Научно-практический клинический центр диагностики и телемедицинских технологий ДЗМ регулярно проводит для разработчиков вебинары, где врачи рассказывают о работе сервисов и дают обратную связь.

Есть в московском эксперименте особенно активные врачи, которые заинтересованы в том, чтобы искусственный интеллект действительно стал их помощником. Так на нас вышли несколько врачей, которые сами пригласили нас к себе в больницу, чтобы рассказать, как сделать наш сервис лучше. Полтора года назад мы таким образом пообщались со многими врачами – а с тремя из них так сдружились, что каждые два месяца (как раз во время новых релизов нашей системы) они приглашают нас к себе за обратной связью. Они выделяют нам 2-3 часа, в течение которых в реальном времени тестируют новую версию и говорят, с чем система справляется хорошо, а что нужно доработать.

Например, однажды новая версия нашей системы для анализа флюорографий и рентгена лёгких отмечала плевральный выпот в синусах и уголках внизу лёгких. По факту это не было плевральным выпотом: там просто накладывались складки лёгких. Благодаря обратной связи мы это сразу же учли, доразметили наши данные, дообучили модель – и через несколько недель избавились от этой ошибки.

Обратная связь пользователей и работа с ней при разработке искусственного интеллекта в медицине

Обратная связь от тех, кто пока не использует

Как мы уже написали выше, решения Цельс применяют более 100 медучреждений в рамках московского эксперимента. Однако помимо нашего сервиса в эксперименте участвует множество сервисов от других разработчиков. – и каждая больница выбирает себе ту ИИ-систему, которую считает лучшей.

Чтобы получить обратную связь, мы посетили больше 20 больниц, которые не используют наши сервисы, и расспросили, какой сервис они считают лучшим и почему именно его. Благодаря этому мы смогли выявить ряд критических моментов – и опять же доработать свои решения. После этого мы попросили врачей, которых до этого опрашивали, параллельно подключить наш сервис, сравнить его с другими, оценить его уже с доработками. В итоге несколько больниц, увидев улучшения, решили перейти на наши сервисы.

Обратная связь от тех, кто планирует пользоваться

Наши решения применяются не только в Москве. Сейчас их применяют уже более 30 регионов РФ – и мы работаем над дальнейшим расширением географии. Когда мы входим в новый регион, мы всегда проводим пилотное тестирование – поскольку иногда ИИ-сервисы могут некорректно работать на разных типах медицинских изображений с разного оборудования. Поэтому на этапе пилота мы непрерывно следим за потоком исследований, проверяем, нет ли каких-то критических ошибок (например, когда система вообще ничего не обработала).

И далее мы снова просим врачей об обратной связи. В данном случае она обычно выглядит так: берутся, например, 100 исследований, их анализирует ИИ, а затем врач заполняет таблицу, где оценивает результаты анализа системой. Всего может быть четыре вида результатов:

  • истинно положительный – в исследовании присутствуют признаки патологии, и искусственный интеллект их обнаружил;
  • ложно положительный – система обнаружила признаки патологии, но на исследовании их нет;
  • истинно отрицательный – искусственный интеллект не обнаружил признаки патологии, и в исследовании их действительно нет;
  • ложно отрицательный – признаки патологии присутствуют, но система их не выявила.

Заполняя таблицу, врачи сообщают нам: в таком-то исследовании ложноположительное срабатывание в такой-то патологии. А мы дополнительно просим их объяснить, почему здесь ошибка и как было бы лучше – и затем тоже берём это в работу, чтобы исправить.

Заключение

На разных этапах развития системы разработчики нуждаются в разных видах обратной связи от медицинского сообщества, и на каждом этапе она совершенно необходима. Поэтому команда Цельс благодарит каждого врача, который взаимодействовал и взаимодействует с нами. Мы считаем вас героями, которые не боятся изучать новые инструменты в своей работе и тем самым приближают медицину будущего.

Всех неравнодушных к нам и к искусственному интеллекту в радиологии приглашаем в ЦЕЛЬС под рентгеном – телеграм-канал, созданный специально для врачей. Там мы обсуждаем интересные случаи, общаемся и шутим.

11
Начать дискуссию