ChatGPT прошел тест Тьюринга лучше людей

Исследователи UC San Diego провели классический тест Тьюринга. Участник одновременно переписывался с человеком и LLM, а потом должен был сказать, кто есть кто. Всего в эксперименте участвовали почти 500 человек.

GPT-4.5 с правильно заданной ролью принимали за человека в 73% случаев. LLaMa-3.1-405B — в 56%. На итог сильно влиял промпт, задающий роль. Без него результаты LLM резко падали.

Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.

Начать дискуссию