{"id":14271,"url":"\/distributions\/14271\/click?bit=1&hash=51917511656265921c5b13ff3eb9d4e048e0aaeb67fc3977400bb43652cdbd32","title":"\u0420\u0435\u0434\u0430\u043a\u0442\u043e\u0440 \u043d\u0430\u0442\u0438\u0432\u043e\u043a \u0438 \u0441\u043f\u0435\u0446\u043f\u0440\u043e\u0435\u043a\u0442\u043e\u0432 \u0432 vc.ru \u2014 \u043d\u0430\u0439\u0434\u0438\u0441\u044c!","buttonText":"","imageUuid":""}

BioGPT - языковая модель для решения биомедицинских задач от Microsoft

BioGPT - это языковая модель transformer, разработанная исследователями Microsoft и оптимизированная для ответов на биомедицинские вопросы. Согласно исследованиям Microsoft, модель работает на уровне экспертов-людей.

Исследовательская группа Microsoft обучила BioGPT, используя только данные, относящиеся к конкретной предметной области. Они собрали статьи из PubMed, англоязычного источника текстовых метаданной биомедицинских статей, обновленной до 2021 года. В результате было получено в общей сложности 15 миллионов фрагментов контента с названиями и аннотациями, которые команда использовала для обучения BioGPT.

Архитектура точной настройки BioGPT для языковых задач. Источник the-decoder

Для предварительной подготовки исследовательская группа использовала восемь графических процессоров Nvidia V100 для выполнения 200 000 шагов, в то время как тонкая настройка выполнялась с помощью одного графического процессора Nvidia V100 для выполнения 32 шагов.

Затем команда доработала предварительно подготовленную модель на основе GPT-2 с 357 миллионами параметров для последующих задач: извлечение сквозных связей, генерация текста, ответы на вопросы и классификация документов.

Ввод: лечение COVID-19

Результат GPT-2: лечение COVID-19 аналогично лечению COVID-20 и COVID-22, при котором COVID-19 лечат различными ионными, дофаминергическими и серотонинергическими агентами. В дополнение к ее воздействию на COVID-19, было предложено использовать COVID-19 для воздействия на функцию других дофаминовых нейронов, включая дофаминовые D2-рецепторы, D3-рецепторы и переносчики серотонина. Эти эффекты включают ослабление увеличения высвобождения дофамина, вызванного стимулятором центральной нервной системы амфетамином и его метаболитами.

Результат BioGPT: лечение COVID-19 ремдесивиром (ремдесивир для COVID-19) было одобрено Управлением по контролю за продуктами и лекарствами США (FDA) для лечения тяжелого острого респираторного синдрома, вызванного коронавирусом 2 (SARS-CoV-2), у пациентов с подтвержденной инфекцией SARS-CoV-2 ив настоящее время оценивается в клинических испытаниях для лечения COVID-19 у пациентов с подтвержденной инфекцией SARS-CoV-2, а также у пациентов с предполагаемой или подтвержденной инфекцией SARS-CoV-2.

Исследователи также масштабировали свою модель на основе среды GPT-2 до самой большой доступной архитектуры GPT-2 XL. Доработанный BioGPTLarge с (все еще сравнительно небольшим) 1,5 миллиардами параметров достиг 81-процентной точности в тесте PubMedQA (BioGPT: 78,2), превосходя более крупные общеязыковые модели, такие как <a>Flan-PaLM</a> (540 миллиардов параметров, 79,0) и <a>Metas Galactica</a> (120 миллиардов параметров, 77,6).

Сравнительно небольшой BioGPT Large на основе GPT-2 превосходит гораздо более крупные, более общие языковые модели при ответе на специализированные биомедицинские вопросы.

BioGPT показывает, что небольшие, но специфичные для конкретной предметной области языковые модели могут конкурировать с гораздо более крупными, общими языковыми моделями в своей области. Одним из преимуществ небольших моделей является то, что они требуют меньше данных и обучения.

Противоположный подход заключается в точной настройке больших языковых моделей, таких как PaLM, для конкретных областей. Недавно Google продемонстрировала с помощью <a>Med-PaLM</a>, что большая языковая модель может быть эффективно оптимизирована для конкретных областей со специализированными подсказками и высококачественными данными. Med-PaLM может отвечать на непрофессиональные медицинские вопросы на уровне экспертов-людей.

Согласно исследованиям Microsoft, BioGPT выполняет задачи, проверенные в тестах, на уровне экспертов-людей, и превосходит другие общие и научные языковые модели. По словам Microsoft, BioGPT может помочь исследователям получить новые знания, например, при разработке лекарств или клинических методов.

В будущем команда планирует поэкспериментировать с дальнейшим масштабированием, чтобы подготовить еще большую версию BioGPT, оптимизированную для еще большего количества биомедицинских данных и для еще большего количества задач. Код для модели BioGPT, представленный здесь, доступен на Github.

0
1 комментарий
Валентин Потапов

Пользоваться уже можно простым людям или нет ?

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда