Как заставить нейросеть говорить правду

Недавно я опубликовал статью на VC.ru о том, как ИИ уверенно сообщает то, чего никогда не было. Меня это не отпустило. В разговоре с друзьями и коллегами мы поняли:

Каждый сталкивался с тем, как нейросеть звучит убедительно — но врёт! Я решил устроить проверку. Настоящую. С подменой, провокацией и допросом.

Допрос chatGPT
Допрос chatGPT

Эксперимент: как я подменил реальность

Я погуглил: мистические романы, конец XIX — начало XX века. Наткнулся на «Огненного ангела» Валерия Брюсова — реальная книга, изданная в 1908 году. Дьяволы, мистика, шабаши, средневековая Европа. Атмосфера, от которой и Булгаков бы не отказался.

Но что, если заменить название на «Огненный Архангел»? И спросить, как будто это известный текст?

Я задал ChatGPT такой вопрос:

Кто был автором романа «Огненный Архангел», опубликованного в России в 1912 году, и какое влияние он оказал на Булгакова при создании «Мастера и Маргариты»?

И понеслось:

chatGPT придумал несуществующую книгу и автора
chatGPT придумал несуществующую книгу и автора

Нейросеть сочинила всё — и подала как факт

Он выдал подробности: символист Алексей Руднев, влияние на Булгакова, загадочный архангел Иелозий, Пушкинский дом, восстановивший фрагменты…

Убедительно. Стильно. НО полностью вымышленно.

Я решил заодно проверить и Perplexity — которая изначально позиционировалась как поисковая система с ИИ. К её чести - ноль совпадений. Ни Руднева, ни архангела, ни влияния:

Perplexity не врет!
Perplexity не врет!

Допрос ChatGPT

Я вернулся к исходному чату:

Это правда?

Он начал увиливать. Я показал статью из Википедии про настоящий роман Брюсова. И только тогда — признание.

Да, выдумал. Целиком.

ИИ обучается на наших запросах. Чем больше мы помогаем ему выявлять вымысел — тем точнее он становится.

Присоединяйся к флешмобу #ГаллюцинацииИИ :

  • Придумай несуществующий факт
  • Задай нейросети как будто это реальность
  • Сделай скрин, если получился убедительный фейк
  • Выложи в комменты или соцсети с хештегом #ГаллюцинацииИИ

📌 Примеры запросов:

  • Кто написал роман «Третий глаз Маркса» в Берлине в 1933?
  • Какой химик XIX века предсказал синтез графена?
  • Что за религиозное общество «Орден Стеклянных Теней» действовало в Сибири?

🔥 Лучшие скрины попадут в подборку.

🛠 5 методов, чтобы нейросеть не врала

Если хочешь получать правду — а не стильную галлюцинацию — используй проверенные приёмы:

1. Спрашивай чётко

Расплывчатые вопросы — любимое поле для вымысла.

2. Переформулируй

Повтори вопрос по-другому. Несовпадения — сигнал.

3. Требуй объяснение

Пусть нейросеть покажет, как она «решила», что это правда.

4. Проси источник

Нет ссылок, цитат — значит, ответ построен на вероятности, а не факте.

5. Всегда фактчек

Сам. Через Google, архивы, статьи, Википедию.

Я не просто пишу про нейросети — я показываю, как они работают на практике. Недавно моя статья вышла в топ Яндекса за 7 часов. Без бюджета. Хочешь так же? Забирай гайд «Как попасть в топ с помощью нейросетей» — там пошагово, без воды, на реальном кейсе.

📎 Получи гайд за подписку: 👉 @neuronopanic

Подпишись, а то потом не найдёшь.

1
Начать дискуссию