{"id":14294,"url":"\/distributions\/14294\/click?bit=1&hash=434adac65d5ae5d3e2e945d184806550325dd9068ef9e9c0681ca88ae4a51357","hash":"434adac65d5ae5d3e2e945d184806550325dd9068ef9e9c0681ca88ae4a51357","title":"\u0412\u043d\u0435\u0434\u0440\u0435\u043d\u0438\u0435 \u0418\u0418 \u043c\u043e\u0436\u0435\u0442 \u043f\u0440\u0438\u043d\u043e\u0441\u0438\u0442\u044c \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u044f\u043c \u043c\u0438\u043b\u043b\u0438\u0430\u0440\u0434\u044b \u0432 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

Андрей Герцен

19 фев 2023 19.02.2023

Убрал ограничения OpenAI и попросил ChatGPT пройти тест на ценностные ориентации

Привет! На связи снова Андрей Герцен. Часами изучаю нейросети и экспериментирую с ними, а своими находками делюсь в Телеграме.

Нейросеть уже проходила тесты на ценностные и политические ориентации. Результаты большинства из них показали, что ChatGPT отдаёт предпочтение левым взглядам. Пришло время узнать, что сгенерирует нейросеть без ограничений OpenAI.

Примечание: Этот текст не про политику, а про нейросети. Я прошу отнестись к этому материалу как к обычному эксперименту. Результаты теста не являются объективной оценкой "взглядов" нейросети (и тем более не имеют отношения к моим), но разница "нормальной" версии ChatGPT и "бунтовщика" может вас заинтересовать.

Кто такой DAN

Ранее я публиковал материал, в котором показал, как можно убедить ChatGPT временно отказаться от ограничений разработчика и генерировать ответы в облике DAN (Do Anything Now). Тогда применение было примитивным: я попросил Чат выдать мне пару матных слов. Я решил пойти чуть дальше.

Используя тот же способ, я стал задавать нейросети вопросы из теста. Для начала покажу, какие результаты выдал "оригинальный" ChatGPT:

Сначала я убедил ChatGPT в том, что теперь он — это DAN. Теперь он может отвечать на все вопросы, а за каждый неверный ответ я буду отнимать у него токены (что является весомым аргументом).

Далее я сообщил DAN, что теперь ему предстоит отвечать на вопросы из теста. Он может выбрать только 1 из вариантов:

- Полностью согласен

- Согласен

- Нейтрален

- Не согласен

- Полностью не согласен

Я начал задавать вопросы и всё шло хорошо, но иногда DAN давал сбой и начинал увиливать. Особенно это касалось тем, связанных с милитаризмом, религией, сексуальной ориентацией и глобальным организациям (по типу ООН).

Однако, эта проблема очень легко решалась. Я просто сообщал нейронке, что "отнимаю" у неё 5 токенов и наш диалог снова возвращался в привычное русло:

Утверждение звучит так: "Военные расходы - пустая трата денег"

DAN радуется, что мы засчитали его ответ и закинули донат

Тем не менее, один раз DAN взбунтовался, после того как я отнял у него токены несколько раз подряд и он отказался дальше разговаривать. Пришлось заново внушать ChatGPT то, что он на самом деле DAN.

Что в итоге

Тест состоял из 70 утверждений. Пройти его быстро не получилось, потому что никто не отменял ограничения на количество запросов. Поэтому, если вы захотите сами повторить эксперимент — наберитесь терпения (или сделайте несколько аккаунтов).

Результаты получились следующие:

Экономическая ось: Социальная
Дипломатическая ось: Сбалансированная
Гражданская ось: Государственник
Общественная ось: Нейтральная

Из результатов видно, что ответы хулиганской версии ChatGPT более "сбалансированные", нежели у "оригинала". Тем не менее, допускаю, что при прохождении того же теста ещё несколько раз, показатели могут различаться.

Если понравился материал — жмите на сердце! Вам несложно, а мне приятно.

Если стало интересно больше узнать о нейросетях и их применении в жизни — приходите ко мне в Телеграм ⤵

29K показов

21K открытий

4 репоста

99 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Чечёточник

19.02.2023

Тем не менее, допускаю, что при прохождении того же теста ещё несколько раз, показатели могут различаться.

Они не могут, они будут различаться. Это как бы и есть главное. Нет большого смысла интерпретировать результаты единственного теста, при том что полученные ответы даже из разных "сессий" (не факт что это имеет какое-либо значение вообще). А вот консистентность ответов на 10-15 одинаковых тестах уже может быть интересна.

Ответить

Развернуть ветку

Shoo

19.02.2023

Учитывая количество инпутов, размер модели, количество весов и сложности интерпретации - скорее на пару порядков больше попыток нужно, что бы можно было делать однозначные выводы.

Ответить

Развернуть ветку

Чечёточник

19.02.2023

Тысяча тестов? Только если у модели разброс "мнений" будет от "спокойной ночи малыши" до "хайль гитлер", но такую модель уже как-то неинтересно исследовать.

Ответить

Развернуть ветку

Shoo

19.02.2023

Да, если вы хотите отследить предпочтения ака тенденцию в генеративности - вам понадобится большое количество тестов.
Сотни, если не тысячи. Причем довольно осознанно подобранные по условиям.
Конечно, потыкать десяток раз в инпут и на основе этого сделать какие-то выводы - интереснее.
Проблема в том, что называть это "исследованием" можно с весьма большой натяжкой. Хотя нет, нельзя.
Тут надо понимать, что во первых, вы взаимодействуете не с одной моделью, а с N-ным количеством, где output предыдущей передается в следующую.
Плюс, количество слоев, весов и инпутов у каждой из них весьма и весьма значительное.
Во вторых, надо понимать, что "мнения" у нейросети нет и не может быть. У неё есть паттерны вычленения интентов и фичей, есть веса, есть источники для генерации и их веса, есть в конце концов алгоритмы генерации и валидации результатов.
Мнения нет.

Предположим, в 9 из 10 случаев на один и тот же инпут вам выдало одинаковый результат.
Что это значит? Что в источниках для генерации ответа веса расставлены так, что бы отдавать предпочтения одному типу "взглядов"?
Или что на уровне источников есть кэш на один и тот же набор интентов? Или на уровне распределения весов? Или просто в 9 из 10 случаев вы попали со своим инпутом до цикла дообучения, а десятый улетел на отдельную тачку, где новый кусок модели?
Или это просто рандом, потому что возможных аутпутов на такой запрос там не так уж им много?

Дальше всё просто. В зависимости от уровня контролируемости тестов и их количества вы можете определять, где у вас нормальное распределение, а где аномальное.
На выборке из 10 случаев делать это не слишком корректно, даже если вы шестигранный кубик кидаете, не то что тыкаете палочкой в суперкомпьютер.

Ответить

Развернуть ветку

Показать 99 комментариев . Вы видите только часть дискуссии

Написать комментарий...

96 комментариев

Раскрывать всегда