Уже лучше человека: BioGPT от Microsoft врывается в медицину
Привет! На связи снова Андрей Герцен. Я изучаю нейросети и активно пишу про них. Сейчас мы с вами наблюдаем взрыв их популярности, в частности ChatGPT. Он существует всего пару месяцев, а уже многим надоел, потому что каждый второй хвастается придуманными слоганами, текстами или составленным резюме :)
Окей, со многими профессиями всё понятно. Вывод из существующих возможностей нейросетей уже можно сделать: они помогают человеку, но заменить его не могут из-за большого количества нюансов. Однако практически ничего не было слышно об участии нейросетей в медицине, а там уже случился большой прорыв. Давайте изучать.
Как работают GPT-нейросети
В своём блоге я стараюсь писать просто о сложном и не совсем понятном, поэтому сейчас без особых заморочек постараемся разобраться в сути GPT. Так будет понятнее объяснить "прорыв" Microsoft. Если я в чём-то ошибусь, то более знающие люди могут меня поправить в комментариях.
GPT (Generative Pre-trained Transformer) — модель машинного обучения, которая способна генерировать текст. Текст она берёт из огромных баз данных и после того, как нейросеть умнеет, она начинает работать на человеческом языке. При этом отвечает на конкретные запросы, а не выдаёт готовую информацию по ключевым словам, как это делают поисковики.
Вообразим, что вы зашли в поисковую систему и захотели что-то найти. Условный Google реагирует на ключевые слова, выдавая готовую информацию из интернета в релевантном порядке. Сгенерировать (!) ответ он не может, в отличие от модели GPT.
В свою очередь GPT умеет составлять ответы на основе того, что вам нужно, а не предлагать заранее готовый материал. Но чтобы составить ответ, нужно иметь источник (базу данных). И вот тут начинается что-то по-настоящему интересное.
Microsoft залетает в медицину со своей BioGPT
BioGPT — это языковая модель от Microsoft, которую научили генерировать тексты и искать информацию в медицинской литературе. В качестве источника для GPT взяли PubMed — огромную базу с рефератами, исследованиями и прочими медицинскими документами.
Суть в том, что модель заточена на работу через «естественный язык», а не ключевые слова. То есть получение нужных данных из базы сильно упрощается, а точность результатов BioGPT выше не только других ИИ, но и показателей человека.
Сейчас вы спросите: как это проверили? Рассказываю
У медицинского "поисковика" PubMed есть PubMedQA. PubMedQA используется для оценки качества моделей машинного обучения, таких как BioGPT. Проверяют через задачу: "отвечать на вопросы".
Когда ИИ отвечает на вопросы, его ответы сравниваются с теми, что предоставляют эксперты в области медицины. Это сравнение используется для оценки качества модели с общей человеческой производительностью (Human Perfomance из графика).
Например, если задать вопрос: "Как лечить диабет?", модель должна найти статьи из базы данных PubMed, содержащие информацию о лечении диабета, и выдать достоверный ответ на вопрос.
В общем, "накачав" знаниями свой GPT под названием BioGPT, в Microsoft провели исследование и установили, что их нейросеть человека уже опередила.
И что?
Это как раз отличный пример того, как нейросеть может помочь врачам устанавливать точные диагнозы и подбирать более правильное лечение, основанное на индивидуальных факторах.
Хорошо это или плохо? С одной стороны — здорово. Людей можно будет более эффективно лечить, а значит всё у всех вскоре будет прекрасно. С другой стороны может быть не всё так однозначно.
Мы можем вообразить очень много вариаций будущего и не все могут показаться радужными. Если в методах лечения или диагнозе ошибётся человек — это человеческий фактор. Но если ошибётся нейросеть, то как следует к этому относиться людям?
Лично я сразу вспомнил фильм "Особое мнение". Только там ИИ принимал решения в далёком 2054 году. Читая такие новости, начинает казаться, что реальность "будущего" произойдёт гораздо раньше.
Если материал вам понравился, то приглашаю в свой Телеграм. Там я изучаю нейросети, рассказываю об их возможностях и провожу весёлые исследования.
Буду очень рад поддержке и вашим комментариям. Всех люблю.