«Это не баг, это галлюцинации»: почему ИИ придумывает факты — и как обнулить эту проблему
Раздражает, когда нейросеть уверенно называет несуществующие даты или «факты»? Это галлюцинации — не поломка, а побочный эффект того, как обучаются модели: они предсказывают вероятные кусочки текста по миллионам примеров. Иногда «самый вероятный ответ» — неправда. Ниже — что провоцирует галлюцинации и как настроить ИИ так, чтобы он реже фантазировал и чаще попадал в точку.
Что такое галлюцинации:
- Определение: модель звучит уверенно, но выдаёт вымышленные факты/ссылки/цитаты.
- Причина: ИИ не «думает», он статистически угадывает продолжение. Если запрос расплывчатый или данных мало/нет — он «додумывает».
Когда галлюцинации случаются чаще всего
- Широкие запросы без рамок «Расскажи всё про достопримечательности России» → модель тянется к общим местам и штампам.
- Запросы на факты без источников «Чем вреден супрастин?» → высокая вероятность некорректных обобщений. (Для медицины/юридических тем всегда требуйте источники и проверяйте вручную.)
- Длинные диалоги без “якоря” контекста Переполнение контекстного окна → ранние условия «выпали», ИИ фантазирует недостающие части.
- Просьба ответить «любой ценой» Нет опции «скажи, что не знаешь» → модель выдумает.
- Отсутствие проверочных шагов Вы берёте первый черновик за финал.
Как уменьшить галлюцинации: 5 «ограждений»
1) Давайте контекст, цель, ограничения и формат
Чем уже рамка — тем меньше пространство для фантазий.
Было (широко):
«Расскажи про достопримечательности России».
Стало (чётко):
«Нужен доклад для ребёнка 9 лет о 5 самых популярных достопримечательностях России. Формат: таблица (№, место, где находится ≤10 слов, почему важно ≤15 слов). В конце — 3 вопроса для одноклассников.»
2) Требуйте источники и право на «не знаю»
Добавьте жёсткое правило: «если нет надёжного источника — скажи об этом».
Шаблон:
«Отвечай только с проверяемыми источниками (официальные сайты, академические публикации, крупные медиа). Если источников нет или данные противоречивы — напиши „недостаточно данных“ и перечисли, что нужно проверить.»
Для медицинских/юридических тем обязательно:
«Используй официальные рекомендации (Минздрав/ВОЗ/регистр ЛС и т. п.). Если нет — сообщи, что нужна консультация специалиста.»
3) Используйте Deep Research / режимы-агенты или подайте реальные материалы
Когда инструмент сам собирает ссылки, он привязывает ответ к источникам. Альтернатива — дать свои: ПДФ, ссылки, заметки — и попросить отвечать только по ним.
Шаблон RAG-стиля:
«Вот материалы [ссылки/файлы]. Отвечай только на их основе. В конце — список использованных фрагментов с цитатами ≤20 слов.»
4) Введите итерации и самопроверку
Первый ответ — это черновик. Просите самокритику и переписывание с учётом ошибок.
Мини-воронка 3 шага:
- «Дай черновик ответа ≤200 слов.»
- «Сделай самопроверку по 5 пунктам: факты/логика/ясность/клише/источники (1–5 баллов) + как улучшить.»
- «Перепиши, исправив слабые места. Добавь ссылки.»
5) Вставляйте якорь-резюме в длинных диалогах
Сжать контекст — и продолжить.
Шаблон:
«Сожми наш диалог в 8–10 пунктов (≤180 слов). Выдели неизменяемые требования. Подтверди, что понял, затем переходи к задаче: [конкретно].»
Примеры «до/после»
До (широко):
«Чем вреден супрастин?»
После (безопасно):
«Сделай краткую справку о препарате „Супрастин“ для взрослой аудитории. Формат: показания/противопоказания/побочные эффекты/заметки о взаимодействиях (по 1–2 пункта, без рекомендаций применения). Источники: только официальная инструкция к препарату и материалы Минздрава/ВОЗ. Если данных недостаточно — напиши «нужна консультация врача».»
До (водяной доклад):
«Расскажи всё о достопримечательностях России.»
После (структурно):
«Доклад для 9 лет, 5 объектов: Кремль, Эрмитаж, Байкал, Петергоф, Собор Василия Блаженного. Стиль — простыми словами, без дат и терминологии выше начальной школы. Формат: вступление 2–3 предложения → по объекту 2 факта + „почему интересно ребёнку“ → 3 вопроса аудитории. Добавь описание картинок (что искать на слайдах).»
Чек-лист быстрого анти-галлюцинационного промпта
- Роль и аудитория («ты — редактор/исследователь; для кого пишем»).
- Цель и критерии («что считаем хорошим результатом»).
- Формат и объём (список/таблица/план, поля, лимиты слов).
- Источники (откуда брать) + право на «не знаю».
- Запреты (клише, общие фразы, «из головы»).
- Итерации (черновик → самопроверка → финал).
- Для длинных задач — якорь-резюме или свои материалы.
Готовые мини-шаблоны
1) Ответ только по источникам
«Используй только эти материалы: [ссылки/файлы]. Если данные не покрывают вопрос — напиши, чего не хватает. В конце — список цитат ≤20 слов и ссылки.»
2) Проверка фактов
«Проверь следующие тезисы. Для каждого: вердикт (верно/частично/неверно), пояснение в 1–2 фразы, ссылка. Если источники расходятся — опиши обе позиции.»
3) Самокритика перед сдачей
«Перед финалом: оцени текст по шкале 1–5 — факты/логика/ясность/источники/повторы. Напиши, что исправляешь, и только потом дай финальную версию.»
Галлюцинации — не «каприз» нейросети, а следствие вероятностной природы моделей и плохих рамок задачи. Контекст + источники + формат + право на «не знаю» + итерации резко снижают фантазии и повышают точность.
В моём Telegram — больше практики: шаблоны анти-галлюцинационных промптов, примеры Deep Research/агентов и разбор типовых ошибок. Ссылка — тут!