Huawei Pura X
Бонобо Канзи
Рабочее место для кота
Протесты против Маска
«Офису» — 20 лет
Ламба из картона
Дорожка для аквабега
Jaguar Type 00 в Париже
Xiaomi SU7 Ultra
Полёт над Луной
Автопилот Tesla на бездорожье
«Игровые» Google Maps

Как технология «Нейросети для нейросетей» помогает бороться с галлюцинациями LLM

В одном из наших материалов мы обсуждали галлюцинации больших языковых моделей и один из способов борьбы с ними — Retrieval Augmented Generation (RAG). Сегодня — ещё об одном подходе, который не позволяет ИИ фантазировать и обманывать пользователей. Это принцип «нейросети для нейросетей».

Нейросети — мощный инструмент на основе машинного обучения. Искусственные нейронные сети, созданные человеком, построены по тому же принципу, что и естественные сети нервных клеток живого организма. Они состоят из взаимосвязанных узлов, обрабатывающих данные и постоянно на них обучающихся.

Сегодня нейросети применяют в различных сферах для автоматизации процессов и принятия эффективных решений.

Галлюцинации и неточности в ответах нейросетей

Несмотря на впечатляющий потенциал, нейросети могут фантазировать и выдумывать, вместо того, чтобы опираться на фактические данные. Это явление называется «галлюцинациями».

Причина возникновения галлюцинаций — в ограниченности данных, на которых обучаются нейросетевые модели. Если в процессе обучения модель не сталкивалась с теми или иными ситуациями или типами данных, она может «домысливать» ответы, основываясь на своих внутренних представлениях. Которые, впрочем, она тоже выработала в процессе обучения. И эти домыслы — серьёзный фактор риска, когда речь идёт о важных решениях.

Посмотрим ещё раз на примеры применения ИИ выше и представим, что в какой-то точке взаимодействия с пользователем нейросеть начинает выдумывать ответы.

На самом деле рассказа «Сосновая доска» Юрий Нагибин никогда не писал. Но ChatGPT знает не только его сюжет, но и что хотел сказать автор 😁  
На самом деле рассказа «Сосновая доска» Юрий Нагибин никогда не писал. Но ChatGPT знает не только его сюжет, но и что хотел сказать автор 😁  

Мы посмеиваемся, когда клиент-мужчина регулярно получает в рекомендациях предметы женского гардероба. Но что произойдёт, если нейросеть станет галлюцинировать в серьёзных вопросах? Если нейросеть, оценивающая кредитные риски для банка, начнёт выдавать необоснованные прогнозы и одобрять кредиты всем подряд? А если нейросеть, ассистирующая врачу, не найдёт подходящей информации и выдумает диагноз, а к нему и схему лечения? Это может обернуться катастрофой.

Инструменты повышения точности ответов нейросетей

Существует несколько подходов к повышению точности и надёжности ответов нейросетевых моделей. Один из них — увеличение объёма и качества обучающих данных. Говоря проще, чем больше примеров для обучения — тем лучше модель сможет обобщать и применять полученные знания.

Другой способ — использование техник регуляризации, которые помогают избежать переобучения модели на тренировочных данных. Переобучение (в английском — overfitting) возникает, когда алгоритм обучения вырабатывает предсказания, строго соответствующие конкретному набору данных, и перестаёт работать с какими-либо другими данными или наблюдениями. Регуляризация «штрафует» модель за слишком большие значения «веса», то есть значимости какого-либо фактора для принятия итогового решения — и так улучшает её способность работать с новыми, незнакомыми примерами, обобщать.

На крайнем правом графике — слишком крутые изгибы переобученной модели. Она прекрасно справляется с данными, на которых она обучена. Но если ей встретятся другие вводные данные, она не сможет экстраполировать на них полученные в процессе обучения знания.
На крайнем правом графике — слишком крутые изгибы переобученной модели. Она прекрасно справляется с данными, на которых она обучена. Но если ей встретятся другие вводные данные, она не сможет экстраполировать на них полученные в процессе обучения знания.

Метод «Нейросети для нейросетей»

Есть и более изящный подход — «нейросети для нейросетей». Суть его в использовании одной нейросетевой модели для проверки работы другой. Представьте, что у вас есть основная модель, которая отвечает на вопросы клиентов. Но прежде, чем клиент увидит эти ответы, их проверит другая модель.

Как проверяющая модель определяет качество ответов? Ключевую роль здесь играет обучение на размеченных данных. Проверяющая модель тренируется на примерах ответов, которые были заранее оценены экспертами как точные или неточные. Таким образом, она учится выявлять признаки достоверности — соответствие ответа контексту вопроса, непротиворечивость, опору на фактические данные и другие.

В процессе обучения проверяющая модель выделяет внутренние представления, которые позволяют ей оценивать качество ответов основной модели. Это скрытые слои нейросети, кодирующие семантическую близость ответа к эталонным, или специальные классификаторы, предсказывающие вероятность ошибки.

Скрытых слоёв в теории может быть неограниченное количество. Чем больше таких слоёв нейронов у сети — тем с более сложными задачами она способна справляться.
Скрытых слоёв в теории может быть неограниченное количество. Чем больше таких слоёв нейронов у сети — тем с более сложными задачами она способна справляться.

Затем эта проверяющая модель даёт основной обратную связь, помогая ей улучшать свои результаты. Например, если ответ вызывает сомнения, проверяющая модель может запросить дополнительную информацию или предложить альтернативный вариант. Таким образом достигается высокая точность и надёжность ответов.

Практические примеры

Применение «нейросетей для нейросетей» уже доказало свою эффективность в реальных бизнес-проектах. Вот несколько примеров.

В чат-боте Anthropic на основе ChatGPT внедрение «нейросетей для нейросетей» позволило снизить количество галлюцинаций и фактических ошибок в ответах более чем на 30% по сравнению с предыдущими версиями.

Другой пример — использование «нейросетей для нейросетей» в рекомендательной системе Amazon. Здесь одна модель предлагает товары, исходя из предпочтений клиента, а вторая оценивает, насколько эти рекомендации соответствуют его интересам. Это позволило снизить количество нерелевантных предложений более чем на 25% и повысить конверсию в продажи на 15%.

Аналогичный подход применяется и в системах финансового скоринга «Альфа-Банка». Одна нейросеть оценивает кредитные риски заёмщиков, а её «коллега» — проверяет достоверность этих оценок, выявляя потенциальные ошибки. Это помогает банку принимать более взвешенные решения о выдаче кредитов, сокращая убытки от невозвратов.

Нейросети для нейросетей VS. RAG

Существует ещё один интересный подход к повышению точности и надёжности ответов нейросеток — технология RAG (Retrieval Augmented Generation).

RAG объединяет в себе две ключевые компоненты:

  • Генеративную нейросеть, которая выдаёт ответы.
  • Модуль извлечения информации, который ищет релевантные данные во внешних источниках.

Таким образом, ответы формируются не только на основе внутренних знаний, полученных в результате обучения, но и с использованием дополнительной информации, извлечённой из внешних баз данных. RAG позволяет «расширить кругозор» нейросети и повысить точность ответов за счёт привлечения внешних источников. Это особенно полезно в ситуациях, когда модель сталкивается с вопросами, выходящими за рамки её обучающих данных.

Модуль извлечения информации помогает большой языковой модели давать более релевантные и точные ответы, обращаясь к внешним верифицированным источникам информации
Модуль извлечения информации помогает большой языковой модели давать более релевантные и точные ответы, обращаясь к внешним верифицированным источникам информации

В свою очередь, подход «нейросети для нейросетей» фокусируется на внутренней проверке и улучшении самой генеративной модели, без привлечения внешних источников. В зависимости от конкретных задач и требований к точности, эти подходы можно использовать автономно или комбинировать.

TL;DR

  • Нейросети находят широкое применение в бизнесе, но могут выдавать неточные ответы, «галлюцинировать».
  • Для повышения точности и достоверности ответов применяется подход «нейросетей для нейросетей», когда одна модель проверяет работу другой.
  • Этот подход уже доказал свою эффективность в реальных проектах, таких, как рекомендательная система Amazon и система скоринга «Альфа-Банка».
  • Использование «нейросетей для нейросетей» позволяет снизить количество ошибок, повысить эффективность бизнес-решений и доверие пользователей.
  • В будущем можно ожидать развития и распространения этого подхода, особенно в бизнес-приложениях, требующих высокой точности.

Этот материал опубликован на «РБК Компаниях».

Александр Обысов
сооснователь и генеральный директор arcsinus
22
реклама
разместить
Начать дискуссию
ИИ без хайпа: что реально работает уже сегодня, а что пока просто красиво звучит? (февраль 2025)

Мы постоянно слышим хайповые заявления: “ИИ нас всех заменит”, “экспертиза больше не является ограничением", “мы уже знаем как создать AGI” итп. Под влиянием медиа и общественных ожиданий многие воспринимают потенциальные или прогнозируемые технологии как уже существующие.

Сложные отношения с большой кучей данных
11
реклама
разместить
Как я научился выжимать максимум из нейросетей для маркетинга (и как вы тоже можете)

Краткое содержание: Сегодня я расскажу, как превратить нейросети из игрушки в рабочий инструмент. Правильно составленные промпты, четкая структура запросов и разделение задач между разными моделями — всё это поможет вам сэкономить массу времени. В статье делюсь конкретными промптами и примерами для проведения маркетингового анализа, создания протот…

Как я научился выжимать максимум из нейросетей для маркетинга (и как вы тоже можете)
1616
Midjourney. Топ-20 промптов для Midjourney. Создаем нереальные шедевры (+ примеры и полезные фишки)
Midjourney. Топ-20 промптов для Midjourney. Создаем нереальные шедевры (+ примеры и полезные фишки)

Наверное, каждый, кто начинает свое знакомство с Midjourney, сталкивается с одной и той же проблемой — как правильно сформулировать свой запрос, чтобы получить именно то изображение, которое видишь в голове? Хочу поделиться с вами коллекцией из 20 эффективных промптов, которые работают в Midjourney как лучший дизайнер!

Автоматизация обратной связи с подписчиками с помощью нейросетей: персонализированные ответы на отзывы и комментарии
Автоматизация обратной связи с подписчиками с помощью нейросетей: персонализированные ответы на отзывы и комментарии
Нейросети на службе человечества: примеры из разных областей, которые вдохновляют

Нейросети и искусственный интеллект (ИИ) стали важными инструментами, которые трансформируют различные индустрии. От медицины до финансов, от развлечений до производства — эти технологии предлагают новые возможности и значительно улучшают существующие процессы. В этой статье мы подробно рассмотрим, как именно нейросети меняют разные отрасли, и прив…

22
Революция в исследованиях: Как генеративные агенты на базе 1000 реальных людей меняют подход к изучению клиентов

В рамках этой статьи мы рассмотрим, как работает эта технология, насколько она точна, и самое главное — как бизнес может использовать этот инструмент для улучшения процессов принятия решений, проведения более эффективных кастдев-интервью и создания продуктов, которые действительно резонируют с целевой аудиторией.

🌱🍓 Саженцы цветов, плодовых деревьев и ягодных кустарников из Краснодарского края завоевали сердца садоводов по всей стране!
🌱🍓 Саженцы цветов, плодовых деревьев и ягодных кустарников из Краснодарского края завоевали сердца садоводов по всей стране!
11
ИИ в HR: хайп или новая реальность

Директор по персоналу arcsinus Мане Фаворская рассказывает о нюансах делегирования HR-задач нейросетям.

22
Вы всё врёте: даже лучшие нейронные сети обманывают нас. Можно ли это исправить?
За пример галлюцинации в актуальной версии GPT-4o спасибо <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fpikabu.ru%2Fstory%2Fchat_gpt_po_sravneniyu_s_dipsik_tupit_12315049&postId=1789466" rel="nofollow noreferrer noopener" target="_blank">FreemanT</a>

Нейросети впечатляют. Они пишут код, составляют тексты, переводят с одного языка на другой. Но иногда они… нагло лгут. Причём делают это с полной уверенностью. Задаёшь вопрос: «Какую книгу написал этот автор?» — и получаешь убедительный, но полностью вымышленный ответ. Запрашиваешь ссылку на источник — и видишь адрес, ведущий в никуда. Почему так п…

88
11
11
реклама
разместить
Chat GPT. Реальные возможности ChatGPT 4.5. Обзор особенностей, преимуществ и ограничений новейшей модели OpenAI

Вы используете ChatGPT, но не получаете ожидаемых результатов? Чувствуете, что теряете время и деньги, разбираясь в настройках?
В этой статье я подробно разберу реальные возможности новой модели ChatGPT 4.5, сравню ее с конкурентами и поделюсь проверенными методами, которые увеличат эффективность вашей работы с нейросетью в 3-5 раз. Узнайте, стоит…

11
Практическое применение: как нейросети могут помочь в анализе конкурентов
Практическое применение: как нейросети могут помочь в анализе конкурентов
11
Как использовать машинное обучение в продажах

Нейросети активно используют в сфере продаж — и если раньше им поручались простые задачи (вроде ответов на запросы клиентов), то сейчас они помогают строить сложные стратегии. Сегодня расскажем о том, как AI помогает в лидогенерации и повышает эффективность воронки продаж.

Как использовать машинное обучение в продажах
[]