Microsoft разработал систему медицинского ИИ, которая ставит диагнозы в 4 раза лучше врачей

Эта новейшая система грозится совершить прорыв в диагностике сложных заболеваний. Технология еще не внедрена в клиники, но уже проходит испытания с медицинскими партнерами. Расскажу о ней подробнее.

🔥 Еще больше интересного в моем канале Продуктовые штучки

На реальных кейсах MAI-DxO показала точность до 85,5%, тогда как опытные врачи в аналогичных условиях справились только с 20% случаев.

Подчеркивается, что задача MAI-DxO — не заменить врачей, а стать инструментом поддержки принятия решений, особенно в сложных случаях и там, где не хватает специалистов.

Microsoft считает MAI-DxO шагом к “медицинскому сверхразуму” — системе, которая в сложных задачах сможем превосходить лучших людей-экспертов.

MAI-DxO имитирует виртуальную группу врачей с разными подходами к диагностике, которые совместно работают над решением задачи, уточняя детали и корректируя гипотезы по мере поступления новых данных

1. Мультиагентная архитектура — виртуальная панель специалистов MAI-DxO не просто использует один ИИ, а объединяет несколько передовых языковых моделей (OpenAI GPT, Google Gemini, Anthropic Claude, Meta Llama, xAI Grok, DeepSeek и др.).

Система моделирует работу врачебного консилиума: каждый ИИ-агент играет роль отдельного “виртуального врача” со своей функцией:

Dr. Hypothesis — формирует и обновляет список возможных диагнозов.
Dr. Test-Chooser — выбирает наиболее информативные и экономически оправданные анализы.
Dr. Challenger — ищет противоречия и не дает “залипнуть” на первой версии диагноза.
Dr. Stewardship — следит за затратами, отклоняет ненужные тесты.
Dr. Checklist — проверяет логику и полноту действий

2. Последовательная, поэтапная диагностика

Система имитирует реальный клинический процесс: начинает с краткой истории болезни, задает уточняющие вопросы, назначает анализы, получает результаты, пересматривает гипотезы — и так до финального диагноза После каждого шага “панель” пересматривает свои выводы, обновляет список диагнозов и решает, что делать дальше — как опытные врачи на консилиуме.

3. Коллективный “chain of debate”

MAI-DxO использует принцип “цепочки обсуждений”: разные ИИ-агенты спорят, предлагают альтернативы, обосновывают выбор тестов и диагнозов, что снижает риск когнитивных ошибок и преждевременных выводов Такой подход позволяет системе не пропускать редкие или нетипичные случаи и избегать типичных врачебных ловушек вроде “якорения” на первой версии.

4. Оптимизация затрат

В отличие от многих ИИ, MAI-DxO учитывает стоимость диагностики: выбирает только действительно нужные анализы и процедуры, что позволяет снизить расходы на 20% по сравнению с врачами. Система отслеживает “бюджет” каждого кейса и балансирует между информативностью и экономичностью.

5. Проверка на самых сложных кейсах

Для тестирования использовались не стандартные задачи, а именно редкие и запутанные случаи из NEJM, где часто ошибаются даже специалисты. Такой бенчмарк максимально приближен к реальным вызовам современной медицины.

Таким образом, MAI-DxO добивается результатов благодаря симуляции коллективного разума врачей, мультиагентной архитектуре, поэтапному процессу диагностики и строгому контролю затрат — и это уже сейчас меняет представление о возможностях ИИ в медицине

Использует итеративный и поэтапный подход, который имитирует работу опытного врача-диагноста. На каждом этапе анализа клинического случая виртуальные ИИ-агенты оценивают имеющиеся данные и определяют, какая информация критична для постановки точного диагноза. Если данных недостаточно, система формулирует уточняющие вопросы к пациенту, чтобы получить ключевые симптомы, детали анамнеза или особенности течения болезни.

Microsoft разработал систему медицинского ИИ, которая ставит диагнозы в 4 раза лучше врачей

Назначает необходимые лабораторные и инструментальные исследования, если текущая информация не позволяет сузить круг возможных диагнозов.

Анализирует ответы и результаты тестов, пересматривая гипотезы и, при необходимости, повторно уточняет детали, пока не будет достигнута достаточная уверенность в диагнозе.

Такой подход позволяет MAI-DxO поэтапно собирать недостающую информацию и избегать ошибок, связанных с неполнотой исходных данных.

В результате система способна выявлять даже редкие и сложные заболевания, которые могли бы быть упущены при стандартном сборе анамнеза одним врачом.

Исследования включают крупное сравнительное тестирование на сложных медицинских кейсах, на 304 сложнейших диагностических случаях из NEJM.

Результаты опубликованы в исследовании Microsoft на arXiv (“Sequential Diagnosis with Language Models”), а также освещены в ведущих СМИ и научных обзорах

В эксперименте участвовали 21 опытный врач из США и Великобритании (с опытом от 5 до 20 лет), которые решали те же задачи, что и ИИ. Врачи работали без доступа к справочникам, коллегам и современным ИИ-инструментам, чтобы сравнение было максимально чистым

Результаты: MAI-DxO достигла точности 85,5% в постановке правильного диагноза. Врачи в среднем правильно диагностировали только 20% случаев.

MAI-DxO также показала меньшие затраты на диагностику (на 20% ниже), так как назначала меньше ненужных тестов

ИИ-системы становятся более надежными в диагностике сложных случаев благодаря способности анализировать огромные объемы данных, отсутствию когнитивных искажений, коллективному подходу, высокой скорости работы и последовательной проверке гипотез.

Это позволяет им выявлять редкие и сложные заболевания с большей точностью и эффективностью, чем отдельный врач, особенно в условиях высокой неопределенности и ограниченности информации