Microsoft разработал систему медицинского ИИ, которая ставит диагнозы в 4 раза лучше врачей

Эта новейшая система грозится совершить прорыв в диагностике сложных заболеваний. Технология еще не внедрена в клиники, но уже проходит испытания с медицинскими партнерами. Расскажу о ней подробнее.

🔥 Еще больше интересного в моем канале Продуктовые штучки

На реальных кейсах MAI-DxO показала точность до 85,5%, тогда как опытные врачи в аналогичных условиях справились только с 20% случаев.

Подчеркивается, что задача MAI-DxO — не заменить врачей, а стать инструментом поддержки принятия решений, особенно в сложных случаях и там, где не хватает специалистов.

Microsoft считает MAI-DxO шагом к “медицинскому сверхразуму” — системе, которая в сложных задачах сможем превосходить лучших людей-экспертов.

Как MAI-DxO достигает такого результата?

MAI-DxO имитирует виртуальную группу врачей с разными подходами к диагностике, которые совместно работают над решением задачи, уточняя детали и корректируя гипотезы по мере поступления новых данных

1. Мультиагентная архитектура — виртуальная панель специалистов MAI-DxO не просто использует один ИИ, а объединяет несколько передовых языковых моделей (OpenAI GPT, Google Gemini, Anthropic Claude, Meta Llama, xAI Grok, DeepSeek и др.).

Система моделирует работу врачебного консилиума: каждый ИИ-агент играет роль отдельного “виртуального врача” со своей функцией:

  • Dr. Hypothesis — формирует и обновляет список возможных диагнозов.
  • Dr. Test-Chooser — выбирает наиболее информативные и экономически оправданные анализы.
  • Dr. Challenger — ищет противоречия и не дает “залипнуть” на первой версии диагноза.
  • Dr. Stewardship — следит за затратами, отклоняет ненужные тесты.
  • Dr. Checklist — проверяет логику и полноту действий

2. Последовательная, поэтапная диагностика

Система имитирует реальный клинический процесс: начинает с краткой истории болезни, задает уточняющие вопросы, назначает анализы, получает результаты, пересматривает гипотезы — и так до финального диагноза После каждого шага “панель” пересматривает свои выводы, обновляет список диагнозов и решает, что делать дальше — как опытные врачи на консилиуме.

3. Коллективный “chain of debate”

MAI-DxO использует принцип “цепочки обсуждений”: разные ИИ-агенты спорят, предлагают альтернативы, обосновывают выбор тестов и диагнозов, что снижает риск когнитивных ошибок и преждевременных выводов Такой подход позволяет системе не пропускать редкие или нетипичные случаи и избегать типичных врачебных ловушек вроде “якорения” на первой версии.

4. Оптимизация затрат

В отличие от многих ИИ, MAI-DxO учитывает стоимость диагностики: выбирает только действительно нужные анализы и процедуры, что позволяет снизить расходы на 20% по сравнению с врачами. Система отслеживает “бюджет” каждого кейса и балансирует между информативностью и экономичностью.

5. Проверка на самых сложных кейсах

Для тестирования использовались не стандартные задачи, а именно редкие и запутанные случаи из NEJM, где часто ошибаются даже специалисты. Такой бенчмарк максимально приближен к реальным вызовам современной медицины.

Таким образом, MAI-DxO добивается результатов благодаря симуляции коллективного разума врачей, мультиагентной архитектуре, поэтапному процессу диагностики и строгому контролю затрат — и это уже сейчас меняет представление о возможностях ИИ в медицине

Устройство системы. Источник
Устройство системы. Источник

Как MAI-DxO уточняет диагноз?

Использует итеративный и поэтапный подход, который имитирует работу опытного врача-диагноста. На каждом этапе анализа клинического случая виртуальные ИИ-агенты оценивают имеющиеся данные и определяют, какая информация критична для постановки точного диагноза. Если данных недостаточно, система формулирует уточняющие вопросы к пациенту, чтобы получить ключевые симптомы, детали анамнеза или особенности течения болезни.

Microsoft разработал систему медицинского ИИ, которая ставит диагнозы в 4 раза лучше врачей

Назначает необходимые лабораторные и инструментальные исследования, если текущая информация не позволяет сузить круг возможных диагнозов.

Анализирует ответы и результаты тестов, пересматривая гипотезы и, при необходимости, повторно уточняет детали, пока не будет достигнута достаточная уверенность в диагнозе.

Такой подход позволяет MAI-DxO поэтапно собирать недостающую информацию и избегать ошибок, связанных с неполнотой исходных данных.

В результате система способна выявлять даже редкие и сложные заболевания, которые могли бы быть упущены при стандартном сборе анамнеза одним врачом.

Какие исследования показывают, что MAI-DxO работает лучше врачей?

Исследования включают крупное сравнительное тестирование на сложных медицинских кейсах, на 304 сложнейших диагностических случаях из NEJM.

Результаты опубликованы в исследовании Microsoft на arXiv (“Sequential Diagnosis with Language Models”), а также освещены в ведущих СМИ и научных обзорах

В эксперименте участвовали 21 опытный врач из США и Великобритании (с опытом от 5 до 20 лет), которые решали те же задачи, что и ИИ. Врачи работали без доступа к справочникам, коллегам и современным ИИ-инструментам, чтобы сравнение было максимально чистым

Результаты: MAI-DxO достигла точности 85,5% в постановке правильного диагноза. Врачи в среднем правильно диагностировали только 20% случаев.

MAI-DxO также показала меньшие затраты на диагностику (на 20% ниже), так как назначала меньше ненужных тестов

Почему ИИ-системы могут быть более надежными в диагностике сложных случаев?

ИИ-системы становятся более надежными в диагностике сложных случаев благодаря способности анализировать огромные объемы данных, отсутствию когнитивных искажений, коллективному подходу, высокой скорости работы и последовательной проверке гипотез.

Это позволяет им выявлять редкие и сложные заболевания с большей точностью и эффективностью, чем отдельный врач, особенно в условиях высокой неопределенности и ограниченности информации

Пожалуйста, поддержите меня, поставьте лайк! 🙏

3
1 комментарий