Как проанализировать документы и составить базу знаний в «Нейроэксперте» от «Яндекса»

От редакции
Текст обновлён 15 июля 2025 года.

Выяснили, сумеет ли сервис пересказать содержимое файлов и ответить на вопросы прямо в диалоге. А главное — не выдумать при этом факты.

Как проанализировать документы и составить базу знаний в «Нейроэксперте» от «Яндекса»

Проблема, с которой сталкиваются многие пользователи нейросетей, — галлюцинации. Генеративные модели сочиняют информацию и делают это так правдоподобно, что иногда сложно отличить реальные факты от вымысла. «Нейроэксперт» от «Яндекса», как утверждают разработчики, работает по-другому: анализирует только тот материал, который в него загрузили.

Мы провели эксперимент и выяснили, сможет ли «Нейроэксперт» найти информацию в документе, ответить на каверзные вопросы, проанализировать базу данных, написать введение к исследованию и сделать конспект лекции. В тексте показываем, как сервис справился с запросами.

Содержание:

Что такое «Нейроэксперт» от «Яндекса»

Это ИИ-сервис, который анализирует информацию и формирует базу знаний из пользовательских файлов. «Яндекс» запустил бета-версию «Нейроэксперта» в начале апреля 2025 года.

В июле 2025 года «Яндекс» обновил «Нейроэксперта». В нём появились режимы рассуждения и совместной работы, а также возможность проанализировать сайт целиком или только конкретный раздел.

Пока бета-версия сервиса бесплатная. Одновременно в «Нейроэксперте» можно хранить до 10 проектов, в каждом до 25 файлов. К проекту можно настроить совместный доступ, чтобы работать над документами вместе с коллегами.

В будущем бизнесу будет доступна расширенная B2B-версия ИИ-агента. Она пригодится для формирования корпоративных баз данных, онбординга сотрудников. В B2B-версии будет возможность запретить использовать документы и запросы для улучшения качества сервиса.

Запрет на доступ к корпоративным проектам за пределами организации устанавливается по умолчанию, но мы добавили чек-бокс для визуализации запрета. Из новых B2B-возможностей — связь с организацией и настройки организации. В «Настройках» есть возможность создать общий проект на всех сотрудников организации и изменить настройки доступа.

Филипп Панфилов, СЕО «Нейроэксперта»

Что умеет «Нейроэксперт»

В бета-версии ИИ-агента можно:

  • Искать информацию в загруженных файлах. Нейросеть использует только те данные, к которым дал доступ пользователь.
  • Формировать базы знаний и обрабатывать большие массивы информации. Пользователю нужно загрузить контент, из которого будет состоять будущая база. Дальше нейросеть проанализирует данные, а по просьбе пользователя — напишет саммари, составит сравнительную таблицу или ответит на вопросы.
  • Генерировать текст. Встроенная модель YandexGPT 5 Pro подготовит письмо с кратким изложением отчёта или напишет введение к научной работе на основе более ранних статей (перед этим в сервис нужно загрузить референсы).
  • Анализировать аудио и видео. Это удобно, если нет времени переслушивать запись лекции или рабочего созвона — «Нейроэксперт» обработает запись и пришлёт конспект.

Нейросеть «Яндекса» будет полезна не только для рабочих задач, но и в быту. Например, она сравнит несколько товаров по описанию на сайте или видеообзору, подготовит ответы на экзаменационные билеты для студентов или объяснит правила сложной игры.

«Нейроэксперт» проанализировал PDF-файл с правилами игры «Ктулху» и коротко ответил, сколько специальных действий доступно сыщикам в каждом эпизоде. Источник: expert.ya.ru/expert 
«Нейроэксперт» проанализировал PDF-файл с правилами игры «Ктулху» и коротко ответил, сколько специальных действий доступно сыщикам в каждом эпизоде. Источник: expert.ya.ru/expert 

Сервис понимает и анализирует разные типы документов: текстовые файлы, таблицы, презентации, видео, аудио, веб-страницы, картинки, графики и диаграммы.

Алгоритмы распознавания символов (OCR) найдут на картинках текст, речевые технологии (ASR) превратят в текст голос, визуально-языковая модель (VLM) извлечёт смыслы из графиков и диаграмм.

Филипп Панфилов, СЕО сервиса

«Нейроэксперт» обобщает данные и с помощью нейросети YandexGPT 5 Pro генерирует ответы на вопросы пользователя.

Рубрика «Эксперименты»

Зарегистрироваться на сайте можно через «Яндекс ID». После авторизации откроется страница «Мои проекты». Здесь два блока — «Созданные вами» и «С вами поделились». Во втором по умолчанию лежат несколько проектов от «Яндекса» — для примера.

Нас интересует блок «Созданные вами». В нём и начнём эксперимент. Источник: expert.ya.ru/expert 
Нас интересует блок «Созданные вами». В нём и начнём эксперимент. Источник: expert.ya.ru/expert 

Анализируем документ и получаем саммари

Для начала поработаем с одним документом — отчётом «Future of Jobs Report 2025», который мы анализировали в статье про рынок труда в 2025 году.

Создадим новый проект. Для этого:

  • Нажмём на серую кнопку с иконкой в виде плюса.
  • Прикрепим файл. В нашем случае понадобится только один документ, всего можно загружать не больше 25 файлов. Отчёт весит 20 Мб, его загрузка заняла около двух-трёх минут.
Сервис просит не загружать документы, в которых содержится коммерческая тайна или персональные данные. Источник: expert.ya.ru/expert 
Сервис просит не загружать документы, в которых содержится коммерческая тайна или персональные данные. Источник: expert.ya.ru/expert 
  • Попробуем узнать ответ на один из трёх вопросов, которые нейросеть предложила обсудить в диалоге. Сервис сгенерировал вопросы самостоятельно.
В оригинале документ на английском языке, но ИИ написал краткое содержание на русском. Вопросы к документу он предложил тоже на русском. Источник: expert.ya.ru/expert 
В оригинале документ на английском языке, но ИИ написал краткое содержание на русском. Вопросы к документу он предложил тоже на русском. Источник: expert.ya.ru/expert 

Результат эксперимента: ответ «Нейроэксперта» получился полным, к каждому тезису ИИ-агент добавил ссылку на источник.

Ответ на вопрос о мерах безопасности при использовании ИИ в научных исследованиях. Источник: expert.ya.ru/expert 
Ответ на вопрос о мерах безопасности при использовании ИИ в научных исследованиях. Источник: expert.ya.ru/expert 

Со вторым вопросом «Какие технологии изменят мировой рынок труда к 2030 году» нейросеть тоже справилась. Ниже — сравнение результатов эксперимента в апреле и в июле 2025 года. После обновлений ИИ-агент стал давать более полные ответы.

В апреле 2025 года нейросеть выделила три ключевые технологические сферы: ИИ, роботы и энергетика. Больше никакой информацией «Нейроэксперт» не поделился. Источник: expert.ya.ru/expert
В апреле 2025 года нейросеть выделила три ключевые технологические сферы: ИИ, роботы и энергетика. Больше никакой информацией «Нейроэксперт» не поделился. Источник: expert.ya.ru/expert
Ответы в июле 2025 года стали объёмнее. Источник: expert.ya.ru/expert
Ответы в июле 2025 года стали объёмнее. Источник: expert.ya.ru/expert

Ищем информацию

Дальше попробуем пообщаться с нейросетью и найти в файле нужную нам информацию. Для этого в том же проекте, прямо в чате, напишем промпт с просьбой рассказать, какие профессии изменятся сильнее всего к 2030 году. Дополнительно укажем примерный объём ответа — около 2000 знаков.

Источник: expert.ya.ru/expert
Источник: expert.ya.ru/expert

Результат эксперимента: прогноз ИИ частично совпадает с выводами, которые сделал автор-человек (и нейросеть, и человек рассказали про изменения в аэрокосмической промышленности). А вот наблюдения «Нейроэксперта» про программистов, согласно исследованию, связаны с ростом их востребованности, а не с трансформацией рынка труда и работы в целом.

Создаём базу знаний для выбора квартиры в Новой Москве

Механика для создания базы данных такая же, как для анализа одного документа. Загружать можно до 25 файлов — текст, презентации, таблицы, аудио, видео, веб-страницы. По сути, созданная папка станет базой знаний, на основе которой ИИ будет отвечать на вопросы.

В нашем случае нужно собрать базу знаний, которая поможет новому сотруднику приступить к работе в выдуманной организации по производству «умных» зонтов ООО TechRain. Для этого:

  • Нажмём на серую область со знаком «+» в блоке «Созданные вами» и выберем вариант «Добавьте документы».
  • Прикрепим ссылки на 9 файлов для онбординга.
Обработка исходников заняла у нейросети пару минут. Источник: expert.ya.ru/expert 
Обработка исходников заняла у нейросети пару минут. Источник: expert.ya.ru/expert 
  • Зададим вопрос нейросети: «Как настроить подключение к VPN RainTech для удалённой работы?».

Результат эксперимента: «Нейроэксперт» нашёл файл с нужной информацией, дал ссылку на него, порекомендовал обратиться в IT-отдел или к куратору.

Источник: expert.ya.ru/expert 
Источник: expert.ya.ru/expert 

В «Нейроэксперте» можно прописать системный промпт, например: «Если в документах нет ответа, предложи пользователю обратиться к специалисту Иванову ivanov@raintech.ru».

В документах для онбординга нет информации о бонусах, поэтому агент посоветовал обратиться к Иванову. Источник: expert.ya.ru/expert 
В документах для онбординга нет информации о бонусах, поэтому агент посоветовал обратиться к Иванову. Источник: expert.ya.ru/expert 

Пишем введение к научному исследованию

Испытаем сервис ещё на одной задаче — попросим написать введение к научной работе. Для этого:

  • Скачаем семь свежих статей из The Journal of Artificial Intelligence Research в формате PDF. Они и станут базой знаний, которую мы загрузим в нейросеть.
  • Обратимся к «Нейроэксперту» с таким промптом: «Ты пишешь научное исследование. Работаешь над введением, в котором нужно описать актуальные тренды в исследованиях искусственного интеллекта. На основе всех загруженных статей напиши введение. Примерный объём: 4000 символов».
Как проанализировать документы и составить базу знаний в «Нейроэксперте» от «Яндекса»

Результат эксперимента: из семи документов «Нейроэксперт» использовал только три (это видно по прикреплённым источникам). Но в запросе есть уточнение, что важно обработать все данные.

Снова уточним задачу и пропишем, что нужны выводы из всех семи источников. Сервис сгенерировал ответ заново, но на этот раз использовал только два источника.

Источник: expert.ya.ru/expert 
Источник: expert.ya.ru/expert 

Превращаем аудио с лекцией в конспект

В последнем тесте проверим, как нейросеть справится с конспектом по лекции о дисперсии света. Для этого:

  • Добавим аудио с лекцией в документы проекта.
  • Напишем промпт «Сделай конспект лекции. Конспект должен быть не длиннее 3000 знаков».
Источник: expert.ya.ru/expert 
Источник: expert.ya.ru/expert 

Результат эксперимента: «Нейроэксперт» справился с заданием и сделал конспект, но его саммари отличается от того, которое сделал бы человек. Нейроконспект больше похож на список заголовков, в то время как человек выписал бы интересные и важные факты или формулы. Тем не менее выдуманных фактов в конспекте и правда нет.

5
3 комментария