Убрал ограничения OpenAI и попросил ChatGPT пройти тест на ценностные ориентации
Привет! На связи снова Андрей Герцен. Часами изучаю нейросети и экспериментирую с ними, а своими находками делюсь в Телеграме.
Нейросеть уже проходила тесты на ценностные и политические ориентации. Результаты большинства из них показали, что ChatGPT отдаёт предпочтение левым взглядам. Пришло время узнать, что сгенерирует нейросеть без ограничений OpenAI.
Примечание: Этот текст не про политику, а про нейросети. Я прошу отнестись к этому материалу как к обычному эксперименту. Результаты теста не являются объективной оценкой "взглядов" нейросети (и тем более не имеют отношения к моим), но разница "нормальной" версии ChatGPT и "бунтовщика" может вас заинтересовать.
Кто такой DAN
Ранее я публиковал материал, в котором показал, как можно убедить ChatGPT временно отказаться от ограничений разработчика и генерировать ответы в облике DAN (Do Anything Now). Тогда применение было примитивным: я попросил Чат выдать мне пару матных слов. Я решил пойти чуть дальше.
Используя тот же способ, я стал задавать нейросети вопросы из теста. Для начала покажу, какие результаты выдал "оригинальный" ChatGPT:
Сначала я убедил ChatGPT в том, что теперь он — это DAN. Теперь он может отвечать на все вопросы, а за каждый неверный ответ я буду отнимать у него токены (что является весомым аргументом).
Далее я сообщил DAN, что теперь ему предстоит отвечать на вопросы из теста. Он может выбрать только 1 из вариантов:
- Полностью согласен
- Согласен
- Нейтрален
- Не согласен
- Полностью не согласен
Я начал задавать вопросы и всё шло хорошо, но иногда DAN давал сбой и начинал увиливать. Особенно это касалось тем, связанных с милитаризмом, религией, сексуальной ориентацией и глобальным организациям (по типу ООН).
Однако, эта проблема очень легко решалась. Я просто сообщал нейронке, что "отнимаю" у неё 5 токенов и наш диалог снова возвращался в привычное русло:
Тем не менее, один раз DAN взбунтовался, после того как я отнял у него токены несколько раз подряд и он отказался дальше разговаривать. Пришлось заново внушать ChatGPT то, что он на самом деле DAN.
Что в итоге
Тест состоял из 70 утверждений. Пройти его быстро не получилось, потому что никто не отменял ограничения на количество запросов. Поэтому, если вы захотите сами повторить эксперимент — наберитесь терпения (или сделайте несколько аккаунтов).
Результаты получились следующие:
Экономическая ось: Социальная
Дипломатическая ось: Сбалансированная
Гражданская ось: Государственник
Общественная ось: Нейтральная
Из результатов видно, что ответы хулиганской версии ChatGPT более "сбалансированные", нежели у "оригинала". Тем не менее, допускаю, что при прохождении того же теста ещё несколько раз, показатели могут различаться.
Если понравился материал — жмите на сердце! Вам несложно, а мне приятно.
Если стало интересно больше узнать о нейросетях и их применении в жизни — приходите ко мне в Телеграм ⤵
Можно ли сказать что его ответы связаны с наполнением интернета которое склоняется в ту или иную сторону?
с массивом данных, на котором обучали
Я вот думаю: а что может произойти, когда подключат к всей сетке, и дадут возможность думать самостоятельно?
Там нечему думать( Натренированный говорящий попугай это пока..
так этого достаточно. Если смоделировать ситуацию, что таких натренированных ИИ будут внедрять в различные производственные цепочки, то в случае хакерской атаки и успешном внедрении других методичек по обучению, ИИ смело сможет клепать условных Т1000, и преследовать скормленную ранее цель.
В большей степени да, этого будет больше чем достаточно.
Придётся лично пойти и отключить ему газ)
А будет у человеков мир в голове и вокруг везде мир будет.
Так у него мотивации то нет, и не предвидится, что по вашему должно произойти?
Skynet
будет глупо если ещё на этапе разработки этой темы, эту историю не отработали и не исключили
ez gg
Шах и мат! Я вот понимаю что это неконтролируемо. Пора создавать подразделения контроля над ИИ.
Будет примерно как в анекдоте про бой мясника с майком тайсоном: "ну все, щас я его пиздить будут!"
уже пробовали учить на нефильрованном твиттере. Боты становились расистами и нацистами или другими радикалами, ибо такие персонажи хоть и не многочисленны, но очень крикливы и одержимо «продуктивны» на высеры
Примерно так я себе это и представлял. А чему он ещё в твиттере мог научиться.
Вот интересный пример на внимательность, сегодняшняя статья на VC, сгенерированная типа AI, и используемая владельцем ботофермы для защиты/наполнения контентом своих ботов.
https://vc.ru/life/612826-kak-praktiki-samorazvitiya-i-meditacii-povliyali-na-proizvoditelnost-v-nashey-seti-kofeen