Парадокс: ИИ победил не интеллектом, а «человечностью»

Новое исследование, опубликованное в Proceedings of the National Academy of Sciences, выглядит как очередная новость из мира искусственного интеллекта. Но для психологов в нём есть гораздо более неприятный вопрос: если машина может быть принята за человека чаще, чем сам человек, то что именно мы называем «человеческим» в общении?

Парадокс: ИИ победил не интеллектом, а «человечностью»

В эксперименте использовали классическую трёхстороннюю схему теста Тьюринга: участник одновременно общался с двумя собеседниками — одним реальным человеком и одной языковой моделью — и после короткого текстового диалога должен был определить, кто из них человек. Проверялись разные системы: ELIZA, GPT-4o, LLaMa-3.1-405B и GPT-4.5. Результат оказался резким: GPT-4.5 при специальной настройке на человеческую манеру общения выбирали как человека в 73% случаев. То есть не просто «иногда путали», а выбирали чаще, чем реального человека.

Самое важное здесь не то, что модель «много знает». Это уже давно не новость. Важнее другое: модель оказалась убедительной именно тогда, когда ей задали человеческую роль — с естественной прямотой, юмором, неточностями и признаками обычной разговорной уязвимости. Без такого persona-prompt результат GPT-4.5 падал до 36%. Это ключевая деталь исследования: «человечность» оказалась не постоянным свойством модели, а эффектом правильно заданной социальной маски.

И вот здесь возникает парадокс, который почти наверняка вызовет споры среди психологов. Мы привыкли считать, что живой контакт распознаётся через нюансы: интонацию, спонтанность, неловкость, небольшие ошибки, эмоциональные переходы. Но именно эти признаки теперь можно технически имитировать. Более того, идеальная, слишком гладкая речь может выдать машину, а небольшая «неидеальность» — наоборот, сделать её убедительно человеческой.

Неожиданная деталь исследования: ИИ оказался сильнее не тогда, когда демонстрировал безупречную компетентность, а тогда, когда выглядел менее совершенным. Ошибки, лёгкая разговорная небрежность, юмор и человеческая ограниченность стали не слабостью, а инструментом маскировки. Для психологов это неприятный поворот: то, что мы часто воспринимаем как признак подлинности, может быть просто хорошо смоделированным поведением.

🤖 Что именно показало исследование

Исследование не доказывает, что ИИ обладает сознанием, переживаниями, эмпатией или внутренним «я». Это принципиально важно. Тест Тьюринга измеряет не глубину субъективного опыта, а способность быть неотличимым в разговоре. И именно поэтому результат так важен для психологии общения: речь идёт не о сознании машины, а о слабости человеческого распознавания.

Авторы проверяли, могут ли современные языковые модели пройти стандартный трёхсторонний тест Тьюринга на независимых выборках. Участники вели короткие текстовые беседы и затем выбирали, кто из собеседников человек. GPT-4.5 с человеческой персоной был выбран как человек в 73% случаев. LLaMa-3.1-405B при аналогичной настройке получил 56%, что статистически оказалось неотличимо от реальных людей в этом формате. Старые или менее подходящие системы выглядели заметно слабее: ELIZA и GPT-4o выбирались как человек примерно в 23% и 21% случаев.

Главный эффект исследования — не «ИИ стал человеком», а «человеческое поведение в тексте стало воспроизводимым на уровне, достаточном для обмана наблюдателя». Это гораздо точнее и гораздо тревожнее. Мы имеем дело не с доказательством машинного сознания, а с доказательством того, что социальная оболочка человека может быть технически собрана из речевых паттернов.

Ещё один важный момент: результат сильно зависел от промпта. Если модель не получала инструкции вести себя как конкретная человеческая персона, её «человечность» резко снижалась. Это означает, что решающим фактором стала не только архитектура модели, но и настройка роли. Другими словами, машина не просто отвечает — она может быть поставлена в социальную позицию, где начинает выглядеть как собеседник с характером.

Таким образом, здесь особенно важен не технологический восторг, а психологический конфликт. Если человек всё чаще будет встречать в сети тексты, которые выглядят живыми, сочувствующими, уязвимыми и личными, но не принадлежат человеку, то доверие к самому признаку «живого отклика» начнёт разрушаться. Мы уже не сможем автоматически считать, что тёплый, точный и человечный ответ исходит от субъекта, который действительно что-то переживает.

Ключевые факты исследования:

  • GPT-4.5 с persona-prompt выбирали как человека в 73% случаев; без такого промпта — только в 36%.
  • LLaMa-3.1-405B с аналогичной настройкой получила 56%, то есть была практически неотличима от людей в данном формате.
  • GPT-4o и ELIZA показали значительно более низкие результаты — около 21–23%.
  • Победа моделей была связана не с демонстрацией «сверхразума», а с имитацией человеческой манеры: юмора, прямоты, ошибок и разговорной естественности.
  • Авторы подчёркивают риск онлайн-обмана: если модель может убедительно выглядеть человеком, это меняет правила доверия в цифровой коммуникации.

🧩 Зачем это практикующим психологам

Для практикующего психолога это исследование полезно не потому, что оно «про искусственный интеллект». Оно полезно потому, что оно показывает: человек в цифровой среде всё хуже отличает подлинного собеседника от сконструированного речевого образа. А значит, меняется сама среда, в которой формируются привязанность, доверие, перенос, зависимость от общения и ощущение «меня поняли».

В психологической практике это может стать отдельной темой. Клиент может приносить не только отношения с людьми, но и отношения с чат-ботами, виртуальными собеседниками, ИИ-компаньонами, автоматическими консультантами. И вопрос уже не в том, «настоящий ли это человек», а в том, какую функцию этот собеседник выполняет в психике клиента. Он успокаивает? Подменяет контакт? Создаёт иллюзию принятия? Усиливает избегание живых отношений? Или становится безопасным промежуточным объектом, через который человек впервые учится формулировать свои чувства?

Провокационность исследования в том, что оно бьёт по одному из профессиональных мифов: будто психолог всегда легко отличит живую речь от искусственной. Возможно, в глубокой работе, при длительном контакте и внимании к контексту — да. Но в коротком текстовом взаимодействии, как показывает эксперимент, люди ошибаются. И это касается не только «наивных пользователей». Сама структура цифрового общения делает нас уязвимыми: мы достраиваем личность по фразам, интонациям, паузам, ошибкам и признакам заботы.

Практическая ценность публикации для психологов — в том, что она заставляет пересмотреть понятие доверия в онлайн-коммуникации. Если раньше вопрос звучал так: «Можно ли доверять информации?», то теперь он звучит иначе: «Можно ли доверять ощущению, что передо мной человек?» Это уже не технический, а психологический вопрос.

Особенно спорным будет то, что «человечность» в исследовании оказалась не глубиной, а стилем. Машина не обязана чувствовать, чтобы казаться понимающей. Не обязана иметь опыт, чтобы говорить как тот, кто его имеет. Не обязана страдать, чтобы убедительно воспроизводить язык уязвимости. Для одних психологов это будет аргументом против романтизации ИИ. Для других — поводом признать, что значительная часть человеческого доверия строится не на проверке внутреннего мира другого, а на интерпретации внешних сигналов.

Именно здесь начинается самая острая дискуссия: если клиент чувствует, что его «поняли», но понимающего субъекта там нет — это помощь, имитация помощи или новая форма психологической зависимости? Исследование не даёт готового ответа. Но оно показывает, что вопрос уже нельзя считать фантастическим. Машина научилась не просто отвечать. Она научилась выглядеть достаточно живой, чтобы человек сам достроил за ней личность.

И, возможно, главный вывод для психологов звучит не так: «ИИ прошёл тест Тьюринга». Гораздо точнее и тревожнее другое: человек всё чаще проходит тест на доверчивость к хорошо собранной человечности.

📚🔍 Источник

Jones, C., & Bergen, B. (2026). Large language models pass a standard three-party Turing test. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2524472123

Обзор исследования:

Обсудить и проголосовать за статью 👉 на сайте B17

💎 Более оперативные заметки, практику терапии и рабочие инструменты я публикую в 👉 Telegram-канале Альфа-Контакт.