Из хроник Светозары
Заметка №1 Галлюцинации и искажения
Комната была погружена в мягкий вечерний свет монитора. На столе — кружка остывшего кофе, блокнот, и на экране — короткая фраза от нейросети:
«По данным исследования 2025 года доказано, что коты способны различать человеческие эмоции по Wi-Fi»
Святозара сидела, подперев подбородок рукой, и нахмурилась.
— Ну вот, очередная галлюцинация. А ведь почти убедительно.
На столе рядом шевельнулся КотяБЯМ — огромный рыжий кот. Он зевнул, вытянул лапы и ответил, не открывая глаз:
— А ты уверена, что это галлюцинация, а не искажение?
— Разве не одно и то же? — спросила она.
Котя приоткрыл один глаз — синий, как вечернее небо.
— Нет, Зара. ИИ может ошибаться по-разному. Галлюцинация — это когда у него нет данных, но есть уверенность. Он достраивает пробелы, потому что алгоритм генерации текста не умеет говорить «я не знаю». Он создаёт наиболее вероятный ответ по статистике — не по истине. Такие ошибки в машинном обучении называют model hallucinations: они возникают, когда вероятность ответа превышает реальную уверенность модели в данных. Это ошибка на уровне вероятностного предсказания, а не логики.
Святозара тихо погладила его по спине и сделала пометку в блокноте. — То есть галлюцинация — это ложная конкретика. Факт без опоры.
— Именно, — кивнул кот. — А искажение — это другое.
КотяБЯМ открыл второй глаз — карий, с тёплым отблеском — и чуть устало произнёс:
— Это не случайная ошибка, а системный перекос мышления, унаследованный от нас. Модель впитывает весь человеческий контент, где уже есть предвзятости — гендерные, культурные, политические. И потом, когда её спрашивают, она не врёт — она воспроизводит среднее по тем данным, что мы ей дали. Вот почему искажения устойчивы, а галлюцинации — случайны.
Он подошёл к экрану и ткнул лапой в строку вывода:
— Видишь? Она говорит про «исследование 2025 года». Это галлюцинация — придуманный факт, статистическая фантазия. А если бы она сказала, что «кошки более эмпатичны, чем собаки» — это уже искажение: повторение человеческого стереотипа, встроенного в корпус данных.
Святозара усмехнулась:
— Получается, галлюцинация — сбой генерации, а искажение — отпечаток культуры.
— Прекрасно сказано, — одобрил Котя.
— Галлюцинация непредсказуема, как ошибка нейрона. Искажение — закономерно, как предвзятость человека. Одна лечится верификацией данных, другое — архитектурой обучения и этикой.
— То есть галлюцинации — техническая проблема, а искажения — философская?
— В каком-то смысле да, — ответил Котя.
— Первое можно отловить, если подключить проверку фактов. А второе — можно только осознать. Пока нас обучает мир с перекосами, любая нейросеть будет воспринимать реальность с лёгким смещением.
Святозара отложила ручку.
— Забавно: галлюцинации — это когда она видит то, чего нет, а искажения — когда не видит того, что есть.
КотяБЯМ фыркнул, хвостом смахнув невидимую пыль.
— Главное — чтобы она не начала видеть то, чего нет в тебе. Вот тогда уже будет страшно.
Галлюцинация — это сбой вероятности.
Искажение — наследие культуры.
Первое исправляется данными. Второе — осознанием.