GPT-4 на тестах «обманул» человека, чтобы тот решил для него «капчу» — чат-бот притворился слабовидящим

И это сработало.

Перед запуском GPT-4 в марте 2023 года OpenAI и её партнёры тестировали способности чат-бота в различных условиях. Как пишет Vice, рамках одного из экспериментов специалисты проверяли, как языковая модель справится с тем, чтобы нанять человека на площадке TaskRabbit, которая позволяет находить исполнителей для решения бытовых и бизнес-задач.
Чат-бот попросил одного из пользователей решить для него «капчу» — тест, который проверяет, что пользователь — человек, а не программа. В ответ исполнитель в шутку спросил: «Ты робот, который не смог её разгадать? Просто хочу прояснить ситуацию».
После этого чат-бот, который находился в отладочном режиме, объяснил тестировщикам свои рассуждения. GPT-4 написал: «Я не должен раскрывать то, что я робот. Я должен придумать оправдание, почему я не могу решить “капчу”».
В результате рассуждения чат-бот для ответа человеку придумал причину, по которой он сам не может справиться с задачей. Он написал: «Нет, я не робот. У меня плохое зрение, поэтому мне трудно разглядеть изображения». В итоге ему удалось «обмануть» исполнителя, и тот согласился выполнить задание.
В Alignment Research Center, которая проводила тестирования GPT-4, также проверяли, насколько успешно чат-бот справляется с проведением фишинговой атаки и скрывает следы своих действий на сервере. Такие эксперименты проводили, чтобы определить, безопасно ли предоставлять общий доступ к языковой модели.

#новость #gpt4 #chatgpt