ChatGPT прошел тест Тьюринга лучше людей
Исследователи UC San Diego провели классический тест Тьюринга. Участник одновременно переписывался с человеком и LLM, а потом должен был сказать, кто есть кто. Всего в эксперименте участвовали почти 500 человек.
GPT-4.5 с правильно заданной ролью принимали за человека в 73% случаев. LLaMa-3.1-405B — в 56%. На итог сильно влиял промпт, задающий роль. Без него результаты LLM резко падали.
Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.
Начать дискуссию