ИИ точнее врачей: GPT-5 показал лучшие результаты на диагностических экзаменах

В новом исследовании Эморийского университета было показано, что GPT-5 уверенно превосходит не только прошлую версию GPT-4o, но и медицинских специалистов в ряде диагностических тестов.

ИИ точнее врачей: GPT-5 показал лучшие результаты на диагностических экзаменах

На экзаменационных клинических вопросах MedQA модель достигла 95,8% точности — это почти на пять пунктов выше результата GPT-4o, который считался лучшим среди ИИ. В мультимодальных задачах, где требуется объединять описание симптомов, историю болезни и результаты визуальной диагностики, GPT-5 набрал 70%. Для сравнения: у GPT-4o было на 30 пунктов меньше.

В отдельных тестах, имитирующих работу врачей-экспертов, GPT-5 показал результаты на 24% выше по качеству рассуждений и на 29% выше по уровню понимания. Более того, модель успешно справилась со сложными клиническими случаями, включая диагностику редких заболеваний вроде синдрома Бурхаве, опираясь на лабораторные показатели и данные КТ.

Исследователи отмечают, что этот скачок меняет саму рамку сравнения. Если GPT-4o демонстрировал «почти человеческий» уровень, то GPT-5 впервые вышел за его пределы. По словам иммунолога Дерии Унутмаза, на горизонте маячит ситуация, когда отказ от использования ИИ в клинической практике может рассматриваться как халатность — настолько велик разрыв между результатами врача и возможностей модели.

Пока GPT-5 остаётся инструментом, а не заменой специалистам. Но тенденция очевидна: чем сложнее становятся модели, тем заметнее разрыв. И вопрос теперь не в том, может ли ИИ догнать врачей, а в том, как именно встроить такие системы в реальную медицину.

А вы бы доверили диагностику своего здоровья ИИ?

1
3 комментария