ChatGPT прошел тест Тьюринга лучше людей

Исследователи UC San Diego провели классический тест Тьюринга. Участник одновременно переписывался с человеком и LLM, а потом должен был сказать, кто есть кто. Всего в эксперименте участвовали почти 500 человек.

GPT-4.5 с правильно заданной ролью принимали за человека в 73% случаев. LLaMa-3.1-405B — в 56%. На итог сильно влиял промпт, задающий роль. Без него результаты LLM резко падали.

https://today.ucsd.edu/story/ai-can-seem-more-human-than-real-humans-in-a-classic-turing-test-study-finds

Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.