Как мы помогаем ученым анализировать научные тексты с помощью ИИ

Работа современного ученого совсем не проста. Об этом могу сказать не понаслышке. Еще будучи аспирантом, помню, как приходилось корпеть над научными работами, книгами, работами конференций, чтоб насобирать обзоры литературы, классификации и т.д. Как жаль, что 15 лет назад не было инструментов для оптимизации этой работы. Мало кто мог представить, что в будущем помощником ученого для решения практических задач станет ИИ.

Меня зовут Дмитрий Зинько и я расскажу, как мы с моим партнером, кандидатом наук Андреем Михайловым решили сделать жизнь ученых немного проще.

Проблема рядового ученого

Что же произошло за последние 20 лет в мировой науке с точки зрения цифр? Совокупное количество научных публикаций выросло почти в 4 раза. Международные и национальные базы научного знания (Scopus, Wos, Elibrary и другие) ежегодно индексируют миллионы новых документов на разных языках мира. Многие эксперты и исследователи заговорили о проблеме информационного взрыва или лавины: ученые просто не успевают знакомиться со все новыми и новыми публикациями, чтобы оставаться во фронтире актуальной научной повестки.

Ученые-исследователи, преподаватели, аспиранты, магистры на постоянной основе должны мониторить, изучать и систематизировать огромные массивы данных, на что уходит значительное количество времени. Особенно остро эта проблема стоит, когда необходимо в сжатые сроки подготовится к проведению исследования, составить доклад на конференцию или написать статью.

Рост создания научных текстов по годам
Рост создания научных текстов по годам

Например, на подготовку теоретического обзора уходит до 30% времени от написания всего текста научной статьи. В среднем ученому для этого требуется проанализировать около 100 научных публикаций, а это больше месяца активной работы!

ИИ-ассистент для ученого

Cybertida.ru – это со-пилот для ученого, который помогает проводить анализ научных публикаций на нечеловеческих скоростях.

Если взять пример про 100 статей для написания обзора и месяц на их обработку человеком, то Cybertida справится с этой задачей за 10–15 минут. Результатом станет эксель-таблица, где будет представлено сравнение всех анализируемых публикаций по заданным параметрам. Также Cybertida сэкономит время на оформление списка литературы, сформировав корректно оформленные библиографические ссылки на каждую статью =)

Сценарии

Обработка большого массива научных статей с Cybertida.

Какие сценарии можно закрыть с помощью кибертиды:

  • Получить систематизированное представление о новых исследованиях в любой области наук.
  • Подготовить качественный обзор научной литературы в структуре IMRAD (или в любой другой структуре)
  • Сделать сравнительный анализ массива научных работ по заданным индивидуальнымпараметрам.

Приведу простой пример. Мы хотим понять, о чем были статьи по теории струн за 2024 год. Открываем любую полнотекстовую базу научных публикаций (например, Scopus, SemanticScholar, eLibrary, Lens и другие) и скачиваем все интересующие статьи на компьютер. Иногда такие массивы могут включать тысячи статей.

Как мы помогаем ученым анализировать научные тексты с помощью ИИ

Загружаем, выбранные файлы в Кибертиду. Выбираем вопросы (в данном случаем анализ по шаблону IMRaD)

Настройка вопросов к научным текстам
Настройка вопросов к научным текстам

Ждем пару минут и получаем результаты в табличном виде в формате IMRaD

Сводная таблица по итогам анализа текстов
Сводная таблица по итогам анализа текстов

Удобно, что вы можете выгрузить результаты в формате excel, для удобной обработки и использования в своей работе при подготовке научных публикаций, докладов, грантовых заявок, презентаций и лекционных материалов.

Вы всегда можете вернуться к результатам в Личном кабинете, или запустить анализ с другими параметрами. Так же в личном кабинете сохраняется ваша библиотека текстов.

История заданий в ИИ-ассистенте Кибертида
История заданий в ИИ-ассистенте Кибертида

При обработке любого файла система формирует метаинформацию, содержащую доступные сведения об авторах, названии статьи, журнале, годе издания, ключевых словах и аннотации, а также генерирует полную библиографическую ссылку. Эта опция позволяет легко ориентироваться в своей научной библиотеке, а также создавать кастомизированные наборы данных с анализом работ конкретного ученого или статей из определенного научного издания.

Библиотека научных текстов в сервисе анализа научных статей Кибертида
Библиотека научных текстов в сервисе анализа научных статей Кибертида

Вы сможете легко находить информацию в полученных результатах, благодаря интеллектуальному поиску.

Если указанный выше сценарий направлен на быстрое ознакомлением с исследованиями по направлению, поиск закономерностей, фокусов и т.д, то углубленное погружение с текст станет возможным с новым инструментом "Диалог со статьей"

Удобство нового функционала в том, что ученый может задавать уточняющие вопросы на русском языке по полному тексту статьи, даже если она написана на английском или китайском.

Все результаты работы с научными текстами хранятся на сервисе и всегда под рукой.

Технологии

В качества базовых моделей используется микс из OpenAi, YandexGpt, Gigachat, LLAma. Выбор модели зависит от предпочтения исследователя и доступно для пользователей оформивших подписку, от выбора модели зависит скорость расхода кредитов сервиса и глубина анализа.

Кейсы

ИИ в помощь ученым-медикам

Приведем пример реальных задач, которые может решать сервис Кибертида. Первый пример от Сеченовского медицинского университета. Стояла задача провести анализ массива публикаций по результатам клинических исследований иподготовить сводную таблицу по заданным параметрам для оценки их релевантности задачам научно-исследовательской работы в интересах дальнейшего анализа полных текстов.

Вот 10 основных параметров из протокола анализа, которые интересовали исследователей:

  • Авторы, год, журнал (метаинформация)
  • Цель исследования
  • Дизайн исследования. Выдать информацию о том как строилось фармакологическое исследование.
  • Критерии. Выдать информацию об основных критериях включения/не включения в РКИ на базе протокола.
  • Клинико-демографические характеристики.
  • Технология сравнения.
  • Конечные точки. Критерии эффективности, безопасности.
  • Результаты исследования.
  • Выводы.
  • Обсуждения. Критическая оценка результатов.
Как мы помогаем ученым анализировать научные тексты с помощью ИИ

По истечению нескольких минут получаем эксель файл с результатами.

По словам Ивахненко Оксаны Игоревны (ассистент Кафедры регуляторных отношений в области обращения лекарственных средств и медицинских изделий) в обычном порядке они бы потратили около 2-х недель на ручной анализ этого массива публикаций.

Программа позволяет сформировать сводную предварительную таблицу с кратким изложением основных моментов публикации для последующих принятий решений о включении в дальнейший анализ полнотекстовых статей. Может использоваться в качестве вспомогательного инструмента при проведении систематического поиска и обзора, сбора и хранения информации о статьях по заданной тематике для дальнейшего использования в иных научно-исследовательских целях.

Ивахненко Оксана Игоревна, Сеченовский Университет.

ИИ в помощь ученым-географам

Второй пример – опыт научных сотрудников Балтийского федерального университета им. И. Канта. Стояла задача проанализировать большой массив статей по цифровой географии, чтобы сформировать релевантную базу статей для последующего наукометрического анализа. Проблема заключалась в том, что после формирования выборки статей в одной из наукометрических баз, их оставалось все еще очень много, и часть из них не подходила под тему исследования. Из 2436 публикаций из первичной выборки после более глубокого анализа с помощью Cybertida было отобрано 218 релевантных документов, что позволило избежать искажения результатов последующего наукометрического анализа.

Как мы помогаем ученым анализировать научные тексты с помощью ИИ

С ростом количества публикаций набирают популярность обзорные статьи, презентующие тенденции в развитии конкретного научного направления, темы, концепции, понятия. В этой связи формирование таких обзоров требует высокой тщательности по формированию массива публикаций и его «очищения» от лишних документов, не отвечающих теме и целям исследования. Наш опыт показал, что без глубокого анализа текстов публикаций в многотысячной выборке подготовить качественный обзор невозможно. Однако это требует много человеческих усилий, и здесь Cybertida – настоящий помощник в решении рутинных исследовательских задач

Михайлова Анна Алексеевна, к.г.н., БФУ им И. Канта

Критика

Справедливо можно сказать, что задачу анализа статьи можно решить в том же самом ChatGpt, зачем покупать еще один сервис.

Главная задача Кибертиды - дать ученым инструмент, который лучше всех помогает оптимизировать сценарий работы ученого в его исследовательской деятельности. Уже сейчас главным отличием Кибертиды является возможность работы с большим количеством файлов, вывод и сохранение информации в. структурированной виде, удобная навигация между исходными данными, результатами анализа, легкая выгрузка в другие системы. Возможность подключать разные модели, которые наилучшим способом решают ваши задачи. Для использования Кибертиды не нужен ВПН и иностранные карты.

Планы на ближайшее будущее

В данный момент мы работаем:

  • Над более глубоким погружением в документы, а именно анализ не только на уровне текста, но и таблиц, графиков, изображений, формул - работы с этими элементами как отдельными объектами.
  • Мы продолжаем экспериментировать с моделями, алгоритмами запросов и форматами выдачи, чтобы сделать Cybertida еще полезнее для исследователей.
  • Интеграция с полнотекстовыми базами научных статей, для подбора материалов для анализа.
  • Расширение лимитов на размеры файлов, кол-ва текста и т.д.

Заключение

Ученые, аспиранты, магистры, исследователи вынуждены изучать огромное количество информации и столкнулись с информационным взрывом.

Наша миссия – оптимизировать сценарии работы с научной литературой для повышения качества исследовательской и образовательной деятельности.

Уже сейчас каждый желающий может зарегистрироваться в сервисе анализа научных текстов Кибертида и попробовать бесплатно основной функционал сервиса. Мы будем признательны, если вы напишите обратную связь после использования в разделах "Идея", подсветите недостающие сценарии использования.

1313
55
1 комментарий

Инструмент использует сочетание моделей OpenAi, YandexGpt, Gigachat и LLAma - интересная сборка, может что то и выходит.

2
Ответить