ChatGPT превзошел врачей в диагностике

** Еще больше интересного в моем канале продуктовые штучки**

Причем с серьезным отрывом. Предсказуемо? И да, и нет, ведь врачи могли пользоваться ChatGPT. Читайте, как (и главное — почему) это произошло.

Врачи, которым был предоставлен ChatGPT-4 вместе с обычными ресурсами, показали результаты лишь немного лучше, чем врачи, у которых не было доступа к чат-боту. К удивлению исследователей, ChatGPT превзошел врачей.

Чат-бот от компании OpenAI получил 90% правильных ответов при диагностике заболевания. Врачи, которым случайным образом было назначено использовать чат-бот, получили средний балл 76%. Против 74% у тех, кому случайным образом было назначено не использовать ChatGPT.

Результаты исследования. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fjamanetwork.com%2Fjournals%2Fjamanetworkopen%2Ffullarticle%2F2825395&postId=1673302" rel="nofollow noreferrer noopener" target="_blank">Источник</a><br />

Исследование продемонстировало непоколебимую веру врачей в поставленный ими диагноз.

Автор исследования, доктор Родман, решил просмотреть журналы сообщений между врачами и ChatGPT. Оказывается, врачи не слушали чат-бота, когда он указывал на что-то, что противоречило их диагнозам, и были привязаны к своему собственному представлению о правильном диагнозе.

Но была и другая проблема: многие врачи не знали, как использовать чат-бота в полной мере. Исследование продемонстрировало, что, хотя врачи используют ИИ инструменты в своей работе, и немногие знают, как максимизмировать использование возможностей чат-ботов.

Врачи относились к чату как к поисковой системе для ответов на вопросов: «Является ли цирроз фактором риска рака? Каковы возможные диагнозы глазной боли?». Лишь часть врачей поняла, что они могут буквально скопировать и вставить всю историю болезни в чат-бот и просто попросить его дать исчерпывающий ответ.

В результате они не смогли воспользоваться способностью ИИ систем решать сложные диагностические задачи. Похоже, предстоит пройти долгий путь, прежде чем этот потенциал будет реализован.

В эксперименте приняли участие 50 врачей, ординаторы и лечащие врачи из нескольких крупных американских больничных сетей, результаты были опубликованы недавно в журнале JAMA Network Open.

Данные об участниах исследования. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fjamanetwork.com%2Fjournals%2Fjamanetworkopen%2Ffullarticle%2F2825395&postId=1673302" rel="nofollow noreferrer noopener" target="_blank">Источник</a><br />

Испытуемым было предоставлено шесть историй болезни, они оценивались по их способности предлагать диагнозы и объяснять, почему они их поддерживают или исключают. Их оценки также включали правильность окончательного диагноза. Оценивали медицинские эксперты, которые видели только ответы, не зная, каким образом был получен этот ответ (были ли они от врача с ChatGPT, врача без него или от самого ChatGPT).

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.nytimes.com%2F2024%2F11%2F17%2Fhealth%2Fchatgpt-ai-doctors-diagnosis.html&postId=1673302" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Истории болезни в исследовании были реальныхми и являются частью набора из 105 случаев, которые использовались исследователями с 1990-х годов. Случаи намеренно никогда не публиковались, чтобы студенты-медики и другие могли пройти тестирование на них без какого-либо предварительного знания. Это также означает, что ChatGPT не мог быть обучен на них.

Чтобы проиллюстрировать результаты, исследователи опубликовали один из шести кейсов вместе с ответами на вопросы от врачей, которые набрали самый высокий и низкий баллы.

По данным материала New York Times

#будущее #будущее_уже_здесь #будущееии #технологии #технологии_будущего #технологиибудущего #chatgpt

Наташа Хазеева

Сервисы

21.09.2024

Видео игры против стресса и гипертонии

Это не шутка. Компания DeepWell Digital Therapeutics получила разрешение от FDA на использование своей технологии в лечебных целях. Это весьма примечательный кейс сразу по нескольким причинам, читайте каким.

Биостимуляция улучшает способность справляться с трудностями и повышает устойчивость за счет снижения стресса и гипертонии. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.massdevice.com%2Fdeepwell-digital-therapeutics-fda-clearance-software-development-kit-stress-hypertension%2F&postId=1469685" rel="nofollow noreferrer noopener" target="_blank">Источник</a><br />

8 комментариев

Archi Brook

02.12.2024

Мне кажется, предел чата именно в базовой диагностике в ближайшие 10 лет.

Хорошие врачи учитывают не только сам диагноз при составлении лечения, но и весь анамнез, уровень жизни, психологический портрет пациента, свой опыт и т.д.

Для создания промта с учетом всех вводных нужны нереальные ресурсы и затраты.
Ну и не стоит забывать, что 10% неточных диагнозов от робота могут привести к более серьезным негативным последствиям, из-за риска самолечения людей

Ответить