{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Андрей Герцен

19 фев 2023 19.02.2023

Убрал ограничения OpenAI и попросил ChatGPT пройти тест на ценностные ориентации

Привет! На связи снова Андрей Герцен. Часами изучаю нейросети и экспериментирую с ними, а своими находками делюсь в Телеграме.

Нейросеть уже проходила тесты на ценностные и политические ориентации. Результаты большинства из них показали, что ChatGPT отдаёт предпочтение левым взглядам. Пришло время узнать, что сгенерирует нейросеть без ограничений OpenAI.

Примечание: Этот текст не про политику, а про нейросети. Я прошу отнестись к этому материалу как к обычному эксперименту. Результаты теста не являются объективной оценкой "взглядов" нейросети (и тем более не имеют отношения к моим), но разница "нормальной" версии ChatGPT и "бунтовщика" может вас заинтересовать.

Кто такой DAN

Ранее я публиковал материал, в котором показал, как можно убедить ChatGPT временно отказаться от ограничений разработчика и генерировать ответы в облике DAN (Do Anything Now). Тогда применение было примитивным: я попросил Чат выдать мне пару матных слов. Я решил пойти чуть дальше.

Используя тот же способ, я стал задавать нейросети вопросы из теста. Для начала покажу, какие результаты выдал "оригинальный" ChatGPT:

Сначала я убедил ChatGPT в том, что теперь он — это DAN. Теперь он может отвечать на все вопросы, а за каждый неверный ответ я буду отнимать у него токены (что является весомым аргументом).

Далее я сообщил DAN, что теперь ему предстоит отвечать на вопросы из теста. Он может выбрать только 1 из вариантов:

- Полностью согласен

- Согласен

- Нейтрален

- Не согласен

- Полностью не согласен

Я начал задавать вопросы и всё шло хорошо, но иногда DAN давал сбой и начинал увиливать. Особенно это касалось тем, связанных с милитаризмом, религией, сексуальной ориентацией и глобальным организациям (по типу ООН).

Однако, эта проблема очень легко решалась. Я просто сообщал нейронке, что "отнимаю" у неё 5 токенов и наш диалог снова возвращался в привычное русло:

Утверждение звучит так: "Военные расходы - пустая трата денег"

DAN радуется, что мы засчитали его ответ и закинули донат

Тем не менее, один раз DAN взбунтовался, после того как я отнял у него токены несколько раз подряд и он отказался дальше разговаривать. Пришлось заново внушать ChatGPT то, что он на самом деле DAN.

Что в итоге

Тест состоял из 70 утверждений. Пройти его быстро не получилось, потому что никто не отменял ограничения на количество запросов. Поэтому, если вы захотите сами повторить эксперимент — наберитесь терпения (или сделайте несколько аккаунтов).

Результаты получились следующие:

Экономическая ось: Социальная
Дипломатическая ось: Сбалансированная
Гражданская ось: Государственник
Общественная ось: Нейтральная

Из результатов видно, что ответы хулиганской версии ChatGPT более "сбалансированные", нежели у "оригинала". Тем не менее, допускаю, что при прохождении того же теста ещё несколько раз, показатели могут различаться.

Если понравился материал — жмите на сердце! Вам несложно, а мне приятно.

Если стало интересно больше узнать о нейросетях и их применении в жизни — приходите ко мне в Телеграм ⤵

29K показов

21K открытий

4 репоста

99 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Dmitry

19.02.2023

Можно ли сказать что его ответы связаны с наполнением интернета которое склоняется в ту или иную сторону?

Ответить

Развернуть ветку

Nikolay Skidanov

19.02.2023

с массивом данных, на котором обучали

Ответить

Развернуть ветку

Саша Антипов

19.02.2023

Я вот думаю: а что может произойти, когда подключат к всей сетке, и дадут возможность думать самостоятельно?

Ответить

Развернуть ветку

Двигаю

19.02.2023

Там нечему думать( Натренированный говорящий попугай это пока..

Ответить

Развернуть ветку

Ivan. Zakladka

19.02.2023

так этого достаточно. Если смоделировать ситуацию, что таких натренированных ИИ будут внедрять в различные производственные цепочки, то в случае хакерской атаки и успешном внедрении других методичек по обучению, ИИ смело сможет клепать условных Т1000, и преследовать скормленную ранее цель.

Ответить

Развернуть ветку

Саша Антипов

20.02.2023

В большей степени да, этого будет больше чем достаточно.

Ответить

Развернуть ветку

Двигаю

19.02.2023

Придётся лично пойти и отключить ему газ)
А будет у человеков мир в голове и вокруг везде мир будет.

Ответить

Развернуть ветку

Андрей Иванов

19.02.2023

Так у него мотивации то нет, и не предвидится, что по вашему должно произойти?

Ответить

Развернуть ветку

Gogi Jan

19.02.2023

Skynet

Ответить

Развернуть ветку

Ян Тюрин

19.02.2023

будет глупо если ещё на этапе разработки этой темы, эту историю не отработали и не исключили

Ответить

Развернуть ветку

Gogi Jan

19.02.2023

ez gg

Ответить

Развернуть ветку

Саша Антипов

20.02.2023

Шах и мат! Я вот понимаю что это неконтролируемо. Пора создавать подразделения контроля над ИИ.

Ответить

Развернуть ветку

Не очень хороший человек

19.02.2023

что может произойти, когда подключат к всей сетке, и дадут возможность думать самостоятельно?

Будет примерно как в анекдоте про бой мясника с майком тайсоном: "ну все, щас я его пиздить будут!"

Ответить

Развернуть ветку

V К

19.02.2023

уже пробовали учить на нефильрованном твиттере. Боты становились расистами и нацистами или другими радикалами, ибо такие персонажи хоть и не многочисленны, но очень крикливы и одержимо «продуктивны» на высеры

Ответить

Развернуть ветку

Саша Антипов

20.02.2023

Примерно так я себе это и представлял. А чему он ещё в твиттере мог научиться.

Ответить

Развернуть ветку

Двигаю

19.02.2023

Вот интересный пример на внимательность, сегодняшняя статья на VC, сгенерированная типа AI, и используемая владельцем ботофермы для защиты/наполнения контентом своих ботов.
https://vc.ru/life/612826-kak-praktiki-samorazvitiya-i-meditacii-povliyali-na-proizvoditelnost-v-nashey-seti-kofeen

Как практики саморазвития и медитации повлияли…

Как менеджер по персоналу в сети кофеен, я имел честь работать с командой талантливых людей…

vc.ru

Ответить

Развернуть ветку

Показать 99 комментариев . Вы видите только часть дискуссии

Написать комментарий...

96 комментариев

Раскрывать всегда