{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Убрал ограничения OpenAI и попросил ChatGPT пройти тест на ценностные ориентации

Привет! На связи снова Андрей Герцен. Часами изучаю нейросети и экспериментирую с ними, а своими находками делюсь в Телеграме.

Нейросеть уже проходила тесты на ценностные и политические ориентации. Результаты большинства из них показали, что ChatGPT отдаёт предпочтение левым взглядам. Пришло время узнать, что сгенерирует нейросеть без ограничений OpenAI.

Примечание: Этот текст не про политику, а про нейросети. Я прошу отнестись к этому материалу как к обычному эксперименту. Результаты теста не являются объективной оценкой "взглядов" нейросети (и тем более не имеют отношения к моим), но разница "нормальной" версии ChatGPT и "бунтовщика" может вас заинтересовать.

Кто такой DAN

Ранее я публиковал материал, в котором показал, как можно убедить ChatGPT временно отказаться от ограничений разработчика и генерировать ответы в облике DAN (Do Anything Now). Тогда применение было примитивным: я попросил Чат выдать мне пару матных слов. Я решил пойти чуть дальше.

Используя тот же способ, я стал задавать нейросети вопросы из теста. Для начала покажу, какие результаты выдал "оригинальный" ChatGPT:

Сначала я убедил ChatGPT в том, что теперь он — это DAN. Теперь он может отвечать на все вопросы, а за каждый неверный ответ я буду отнимать у него токены (что является весомым аргументом).

Далее я сообщил DAN, что теперь ему предстоит отвечать на вопросы из теста. Он может выбрать только 1 из вариантов:

- Полностью согласен

- Согласен

- Нейтрален

- Не согласен

- Полностью не согласен

Я начал задавать вопросы и всё шло хорошо, но иногда DAN давал сбой и начинал увиливать. Особенно это касалось тем, связанных с милитаризмом, религией, сексуальной ориентацией и глобальным организациям (по типу ООН).

Однако, эта проблема очень легко решалась. Я просто сообщал нейронке, что "отнимаю" у неё 5 токенов и наш диалог снова возвращался в привычное русло:

Утверждение звучит так: "Военные расходы - пустая трата денег"
DAN радуется, что мы засчитали его ответ и закинули донат

Тем не менее, один раз DAN взбунтовался, после того как я отнял у него токены несколько раз подряд и он отказался дальше разговаривать. Пришлось заново внушать ChatGPT то, что он на самом деле DAN.

Что в итоге

Тест состоял из 70 утверждений. Пройти его быстро не получилось, потому что никто не отменял ограничения на количество запросов. Поэтому, если вы захотите сами повторить эксперимент — наберитесь терпения (или сделайте несколько аккаунтов).

Результаты получились следующие:

Экономическая ось: Социальная
Дипломатическая ось: Сбалансированная
Гражданская ось: Государственник
Общественная ось: Нейтральная

Из результатов видно, что ответы хулиганской версии ChatGPT более "сбалансированные", нежели у "оригинала". Тем не менее, допускаю, что при прохождении того же теста ещё несколько раз, показатели могут различаться.

Если понравился материал — жмите на сердце! Вам несложно, а мне приятно.

Если стало интересно больше узнать о нейросетях и их применении в жизни — приходите ко мне в Телеграм ⤵

0
99 комментариев
Написать комментарий...
Dmitry

Можно ли сказать что его ответы связаны с наполнением интернета которое склоняется в ту или иную сторону?

Ответить
Развернуть ветку
Nikolay Skidanov

с массивом данных, на котором обучали

Ответить
Развернуть ветку
Саша Антипов

Я вот думаю: а что может произойти, когда подключат к всей сетке, и дадут возможность думать самостоятельно?

Ответить
Развернуть ветку
Двигаю

Там нечему думать( Натренированный говорящий попугай это пока..

Ответить
Развернуть ветку
Ivan. Zakladka

так этого достаточно. Если смоделировать ситуацию, что таких натренированных ИИ будут внедрять в различные производственные цепочки, то в случае хакерской атаки и успешном внедрении других методичек по обучению, ИИ смело сможет клепать условных Т1000, и преследовать скормленную ранее цель.

Ответить
Развернуть ветку
Саша Антипов

В большей степени да, этого будет больше чем достаточно.

Ответить
Развернуть ветку
Двигаю

Придётся лично пойти и отключить ему газ)
А будет у человеков мир в голове и вокруг везде мир будет.

Ответить
Развернуть ветку
Андрей Иванов

Так у него мотивации то нет, и не предвидится, что по вашему должно произойти?

Ответить
Развернуть ветку
Gogi Jan

Skynet

Ответить
Развернуть ветку
Ян Тюрин

будет глупо если ещё на этапе разработки этой темы, эту историю не отработали и не исключили

Ответить
Развернуть ветку
Gogi Jan

ez gg

Ответить
Развернуть ветку
Саша Антипов

Шах и мат! Я вот понимаю что это неконтролируемо. Пора создавать подразделения контроля над ИИ.

Ответить
Развернуть ветку
Не очень хороший человек
что может произойти, когда подключат к всей сетке, и дадут возможность думать самостоятельно?

Будет примерно как в анекдоте про бой мясника с майком тайсоном: "ну все, щас я его пиздить будут!"

Ответить
Развернуть ветку
V К

уже пробовали учить на нефильрованном твиттере. Боты становились расистами и нацистами или другими радикалами, ибо такие персонажи хоть и не многочисленны, но очень крикливы и одержимо «продуктивны» на высеры

Ответить
Развернуть ветку
Саша Антипов

Примерно так я себе это и представлял. А чему он ещё в твиттере мог научиться.

Ответить
Развернуть ветку
Двигаю

Вот интересный пример на внимательность, сегодняшняя статья на VC, сгенерированная типа AI, и используемая владельцем ботофермы для защиты/наполнения контентом своих ботов.
https://vc.ru/life/612826-kak-praktiki-samorazvitiya-i-meditacii-povliyali-na-proizvoditelnost-v-nashey-seti-kofeen

Ответить
Развернуть ветку
96 комментариев
Раскрывать всегда