Как проанализировать документы и составить базу знаний в «Нейроэксперте» от «Яндекса»
Выяснили, сумеет ли сервис пересказать содержимое файлов и ответить на вопросы прямо в диалоге. А главное — не выдумать при этом факты.
Проблема, с которой сталкиваются многие пользователи нейросетей, — галлюцинации. Генеративные модели сочиняют информацию и делают это так правдоподобно, что иногда сложно отличить реальные факты от вымысла. «Нейроэксперт» от «Яндекса», как утверждают разработчики, работает по-другому: анализирует только тот материал, который в него загрузили.
Мы провели эксперимент и выяснили, сможет ли «Нейроэксперт» найти информацию в документе, ответить на каверзные вопросы, проанализировать базу данных, написать введение к исследованию и сделать конспект лекции. В тексте показываем, как сервис справился с запросами.
Содержание:
Что такое «Нейроэксперт» от «Яндекса»
Это ИИ-сервис, который анализирует информацию и формирует базу знаний из пользовательских файлов. «Яндекс» запустил бета-версию «Нейроэксперта» в начале апреля 2025 года.
В июле 2025 года «Яндекс» обновил «Нейроэксперта». В нём появились режимы рассуждения и совместной работы, а также возможность проанализировать сайт целиком или только конкретный раздел.
Пока бета-версия сервиса бесплатная. Одновременно в «Нейроэксперте» можно хранить до 10 проектов, в каждом до 25 файлов. К проекту можно настроить совместный доступ, чтобы работать над документами вместе с коллегами.
В будущем бизнесу будет доступна расширенная B2B-версия ИИ-агента. Она пригодится для формирования корпоративных баз данных, онбординга сотрудников. В B2B-версии будет возможность запретить использовать документы и запросы для улучшения качества сервиса.
Запрет на доступ к корпоративным проектам за пределами организации устанавливается по умолчанию, но мы добавили чек-бокс для визуализации запрета. Из новых B2B-возможностей — связь с организацией и настройки организации. В «Настройках» есть возможность создать общий проект на всех сотрудников организации и изменить настройки доступа.
Что умеет «Нейроэксперт»
В бета-версии ИИ-агента можно:
- Искать информацию в загруженных файлах. Нейросеть использует только те данные, к которым дал доступ пользователь.
- Формировать базы знаний и обрабатывать большие массивы информации. Пользователю нужно загрузить контент, из которого будет состоять будущая база. Дальше нейросеть проанализирует данные, а по просьбе пользователя — напишет саммари, составит сравнительную таблицу или ответит на вопросы.
- Генерировать текст. Встроенная модель YandexGPT 5 Pro подготовит письмо с кратким изложением отчёта или напишет введение к научной работе на основе более ранних статей (перед этим в сервис нужно загрузить референсы).
- Анализировать аудио и видео. Это удобно, если нет времени переслушивать запись лекции или рабочего созвона — «Нейроэксперт» обработает запись и пришлёт конспект.
Нейросеть «Яндекса» будет полезна не только для рабочих задач, но и в быту. Например, она сравнит несколько товаров по описанию на сайте или видеообзору, подготовит ответы на экзаменационные билеты для студентов или объяснит правила сложной игры.
Сервис понимает и анализирует разные типы документов: текстовые файлы, таблицы, презентации, видео, аудио, веб-страницы, картинки, графики и диаграммы.
Алгоритмы распознавания символов (OCR) найдут на картинках текст, речевые технологии (ASR) превратят в текст голос, визуально-языковая модель (VLM) извлечёт смыслы из графиков и диаграмм.
«Нейроэксперт» обобщает данные и с помощью нейросети YandexGPT 5 Pro генерирует ответы на вопросы пользователя.
Рубрика «Эксперименты»
Зарегистрироваться на сайте можно через «Яндекс ID». После авторизации откроется страница «Мои проекты». Здесь два блока — «Созданные вами» и «С вами поделились». Во втором по умолчанию лежат несколько проектов от «Яндекса» — для примера.
Анализируем документ и получаем саммари
Для начала поработаем с одним документом — отчётом «Future of Jobs Report 2025», который мы анализировали в статье про рынок труда в 2025 году.
Создадим новый проект. Для этого:
- Нажмём на серую кнопку с иконкой в виде плюса.
- Прикрепим файл. В нашем случае понадобится только один документ, всего можно загружать не больше 25 файлов. Отчёт весит 20 Мб, его загрузка заняла около двух-трёх минут.
- Попробуем узнать ответ на один из трёх вопросов, которые нейросеть предложила обсудить в диалоге. Сервис сгенерировал вопросы самостоятельно.
Результат эксперимента: ответ «Нейроэксперта» получился полным, к каждому тезису ИИ-агент добавил ссылку на источник.
Со вторым вопросом «Какие технологии изменят мировой рынок труда к 2030 году» нейросеть тоже справилась. Ниже — сравнение результатов эксперимента в апреле и в июле 2025 года. После обновлений ИИ-агент стал давать более полные ответы.
Ищем информацию
Дальше попробуем пообщаться с нейросетью и найти в файле нужную нам информацию. Для этого в том же проекте, прямо в чате, напишем промпт с просьбой рассказать, какие профессии изменятся сильнее всего к 2030 году. Дополнительно укажем примерный объём ответа — около 2000 знаков.
Результат эксперимента: прогноз ИИ частично совпадает с выводами, которые сделал автор-человек (и нейросеть, и человек рассказали про изменения в аэрокосмической промышленности). А вот наблюдения «Нейроэксперта» про программистов, согласно исследованию, связаны с ростом их востребованности, а не с трансформацией рынка труда и работы в целом.
Создаём базу знаний для выбора квартиры в Новой Москве
Механика для создания базы данных такая же, как для анализа одного документа. Загружать можно до 25 файлов — текст, презентации, таблицы, аудио, видео, веб-страницы. По сути, созданная папка станет базой знаний, на основе которой ИИ будет отвечать на вопросы.
В нашем случае нужно собрать базу знаний, которая поможет новому сотруднику приступить к работе в выдуманной организации по производству «умных» зонтов ООО TechRain. Для этого:
- Нажмём на серую область со знаком «+» в блоке «Созданные вами» и выберем вариант «Добавьте документы».
- Прикрепим ссылки на 9 файлов для онбординга.
- Зададим вопрос нейросети: «Как настроить подключение к VPN RainTech для удалённой работы?».
Результат эксперимента: «Нейроэксперт» нашёл файл с нужной информацией, дал ссылку на него, порекомендовал обратиться в IT-отдел или к куратору.
В «Нейроэксперте» можно прописать системный промпт, например: «Если в документах нет ответа, предложи пользователю обратиться к специалисту Иванову ivanov@raintech.ru».
Пишем введение к научному исследованию
Испытаем сервис ещё на одной задаче — попросим написать введение к научной работе. Для этого:
- Скачаем семь свежих статей из The Journal of Artificial Intelligence Research в формате PDF. Они и станут базой знаний, которую мы загрузим в нейросеть.
- Обратимся к «Нейроэксперту» с таким промптом: «Ты пишешь научное исследование. Работаешь над введением, в котором нужно описать актуальные тренды в исследованиях искусственного интеллекта. На основе всех загруженных статей напиши введение. Примерный объём: 4000 символов».
Результат эксперимента: из семи документов «Нейроэксперт» использовал только три (это видно по прикреплённым источникам). Но в запросе есть уточнение, что важно обработать все данные.
Снова уточним задачу и пропишем, что нужны выводы из всех семи источников. Сервис сгенерировал ответ заново, но на этот раз использовал только два источника.
Превращаем аудио с лекцией в конспект
В последнем тесте проверим, как нейросеть справится с конспектом по лекции о дисперсии света. Для этого:
- Добавим аудио с лекцией в документы проекта.
- Напишем промпт «Сделай конспект лекции. Конспект должен быть не длиннее 3000 знаков».
Результат эксперимента: «Нейроэксперт» справился с заданием и сделал конспект, но его саммари отличается от того, которое сделал бы человек. Нейроконспект больше похож на список заголовков, в то время как человек выписал бы интересные и важные факты или формулы. Тем не менее выдуманных фактов в конспекте и правда нет.