«Это не баг, это галлюцинации»: почему ИИ придумывает факты — и как обнулить эту проблему

Раздражает, когда нейросеть уверенно называет несуществующие даты или «факты»? Это галлюцинации — не поломка, а побочный эффект того, как обучаются модели: они предсказывают вероятные кусочки текста по миллионам примеров. Иногда «самый вероятный ответ» — неправда. Ниже — что провоцирует галлюцинации и как настроить ИИ так, чтобы он реже фантазировал и чаще попадал в точку.

Что такое галлюцинации:

  • Определение: модель звучит уверенно, но выдаёт вымышленные факты/ссылки/цитаты.
  • Причина: ИИ не «думает», он статистически угадывает продолжение. Если запрос расплывчатый или данных мало/нет — он «додумывает».

Когда галлюцинации случаются чаще всего

  1. Широкие запросы без рамок «Расскажи всё про достопримечательности России» → модель тянется к общим местам и штампам.
  2. Запросы на факты без источников «Чем вреден супрастин?» → высокая вероятность некорректных обобщений. (Для медицины/юридических тем всегда требуйте источники и проверяйте вручную.)
  3. Длинные диалоги без “якоря” контекста Переполнение контекстного окна → ранние условия «выпали», ИИ фантазирует недостающие части.
  4. Просьба ответить «любой ценой» Нет опции «скажи, что не знаешь» → модель выдумает.
  5. Отсутствие проверочных шагов Вы берёте первый черновик за финал.

Как уменьшить галлюцинации: 5 «ограждений»

1) Давайте контекст, цель, ограничения и формат

Чем уже рамка — тем меньше пространство для фантазий.

Было (широко):

«Расскажи про достопримечательности России».

Стало (чётко):

«Нужен доклад для ребёнка 9 лет о 5 самых популярных достопримечательностях России. Формат: таблица (№, место, где находится ≤10 слов, почему важно ≤15 слов). В конце — 3 вопроса для одноклассников.»

2) Требуйте источники и право на «не знаю»

Добавьте жёсткое правило: «если нет надёжного источника — скажи об этом».

Шаблон:

«Отвечай только с проверяемыми источниками (официальные сайты, академические публикации, крупные медиа). Если источников нет или данные противоречивы — напиши „недостаточно данных“ и перечисли, что нужно проверить.»

Для медицинских/юридических тем обязательно:

«Используй официальные рекомендации (Минздрав/ВОЗ/регистр ЛС и т. п.). Если нет — сообщи, что нужна консультация специалиста.»

3) Используйте Deep Research / режимы-агенты или подайте реальные материалы

Когда инструмент сам собирает ссылки, он привязывает ответ к источникам. Альтернатива — дать свои: ПДФ, ссылки, заметки — и попросить отвечать только по ним.

Шаблон RAG-стиля:

«Вот материалы [ссылки/файлы]. Отвечай только на их основе. В конце — список использованных фрагментов с цитатами ≤20 слов.»

4) Введите итерации и самопроверку

Первый ответ — это черновик. Просите самокритику и переписывание с учётом ошибок.

Мини-воронка 3 шага:

  1. «Дай черновик ответа ≤200 слов.»
  2. «Сделай самопроверку по 5 пунктам: факты/логика/ясность/клише/источники (1–5 баллов) + как улучшить.»
  3. «Перепиши, исправив слабые места. Добавь ссылки.»

5) Вставляйте якорь-резюме в длинных диалогах

Сжать контекст — и продолжить.

Шаблон:

«Сожми наш диалог в 8–10 пунктов (≤180 слов). Выдели неизменяемые требования. Подтверди, что понял, затем переходи к задаче: [конкретно].»

Примеры «до/после»

До (широко):

«Чем вреден супрастин?»

После (безопасно):

«Сделай краткую справку о препарате „Супрастин“ для взрослой аудитории. Формат: показания/противопоказания/побочные эффекты/заметки о взаимодействиях (по 1–2 пункта, без рекомендаций применения). Источники: только официальная инструкция к препарату и материалы Минздрава/ВОЗ. Если данных недостаточно — напиши «нужна консультация врача».»

До (водяной доклад):

«Расскажи всё о достопримечательностях России.»

После (структурно):

«Доклад для 9 лет, 5 объектов: Кремль, Эрмитаж, Байкал, Петергоф, Собор Василия Блаженного. Стиль — простыми словами, без дат и терминологии выше начальной школы. Формат: вступление 2–3 предложения → по объекту 2 факта + „почему интересно ребёнку“ → 3 вопроса аудитории. Добавь описание картинок (что искать на слайдах).»

Чек-лист быстрого анти-галлюцинационного промпта

  • Роль и аудитория («ты — редактор/исследователь; для кого пишем»).
  • Цель и критерии («что считаем хорошим результатом»).
  • Формат и объём (список/таблица/план, поля, лимиты слов).
  • Источники (откуда брать) + право на «не знаю».
  • Запреты (клише, общие фразы, «из головы»).
  • Итерации (черновик → самопроверка → финал).
  • Для длинных задач — якорь-резюме или свои материалы.

Готовые мини-шаблоны

1) Ответ только по источникам

«Используй только эти материалы: [ссылки/файлы]. Если данные не покрывают вопрос — напиши, чего не хватает. В конце — список цитат ≤20 слов и ссылки.»

2) Проверка фактов

«Проверь следующие тезисы. Для каждого: вердикт (верно/частично/неверно), пояснение в 1–2 фразы, ссылка. Если источники расходятся — опиши обе позиции.»

3) Самокритика перед сдачей

«Перед финалом: оцени текст по шкале 1–5 — факты/логика/ясность/источники/повторы. Напиши, что исправляешь, и только потом дай финальную версию.»

Галлюцинации — не «каприз» нейросети, а следствие вероятностной природы моделей и плохих рамок задачи. Контекст + источники + формат + право на «не знаю» + итерации резко снижают фантазии и повышают точность.

В моём Telegram — больше практики: шаблоны анти-галлюцинационных промптов, примеры Deep Research/агентов и разбор типовых ошибок. Ссылка — тут!

1
2 комментария