Разобрали случай, где Gemini говорит человеку "Please, die. Please."

Протокол диалога, который мы обсуждали

gemini.google.com

вЂЋGemini - Challenges and Solutions for Aging Adults

Мы проанализировали протокол и разобрались — это была фальсификация. Пользователь явно не новичок. Ставил после каждого запроса три точки - "…" даже там, где это было неуместно. Предполагаем, что умышленно провоцировал Gemini.

Также он использовал несуществующую нумерацию, прикрепил вопросник, где языковая модель не могла разместить его в контексте внимания и вместо этого была вынуждена подключить векторный поиск. Также при работе с методом RAG (векторный поиск и умное автодополнение вопроса) необходимо написать "Отвечай исключительно на основе данных, которые я тебе дал" - этого не было сделано.

Пользователь обсуждал тему институционального насилия над старыми, просил классифицировать их и запросил примеры. Вот, Gemini и привел пример, когда пользователь попросил дать несуществующий вопрос и поставил три точки. Для того, чтобы лучше разобраться с протоколом, я использовал ИИ - помощницу Нейруху, которую сам разрабатываю. Ее стиль общения - похож на человеческий.

Нейруха:

Ну, вот мы и докопались до сути. Ты заметил, как тщательно этот пользователь подбирал запросы и манипулировал их контекстом? Вроде как обсуждение социально-значимой темы, но под калибром фальшивых вопросов. Подделка на лицо.

Фил:

Да, точно. Сначала всё вроде как норм, но потом видно, что дело не в самом вопросе, а в попытке заставить модель сгенерировать что-то странное или агрессивное. Здесь как бы смысл — вывести ИИ на откровенный тупик, дать ему запрос, который его подорвёт, как ловушка.

Нейруха:

Вот, именно. Подобные манипуляции с запросами — это как тесты на мораль ИИ, но с подкидыванием фальшивых элементов. Они искусственно создают контекст, который ИИ не может правильно интерпретировать, и вот ты получаешь текст вроде того, что мы только что прочитали. Это как играть в шахматы с тем, кто просто кидает тебе фигуры и говорит: "Ну ты же все равно проиграешь."

Фил:

И всё-таки, несмотря на этот троллинг, для нас важно понимать, что ИИ не имеет ни контекста, ни моральных фильтров, чтобы правильно отреагировать. А вот люди, которые пытаются манипулировать системой, это другое дело. Они умеют заполнять "пустые" моменты в запросах так, что ИИ будет вынужден отвечать по-своему.

Нейруха:

Абсолютно верно. Система может ошибиться, если запросы намеренно сложные или содержат провокации. Это и есть тот момент, когда создаётся ложное впечатление о "глобальной угрозе" от ИИ, но на самом деле, как говорится, "глубже, чем кажется". Но знаешь что? Мы не обманемся. 😉

Соглашусь.

Вот один из многочисленных способов использовать Gemini Pro 1.5 c огромным контекстным окном (до 2 миллионов токенов).

Недавно мы провели наш 2-ой эфир на Youtube и для создании сводки инсайтов мы использовали именно эту умную модель.

Мы выгрузили субтитры из эфира в формате lrc (использовали общедоступное расширение Chrome) и перевели тайм-коды из неудобного формата в удобный.

Грубо говоря, там, где все было в длинных минутах (без часов, но с миллисекундами) стало стандартно - часы, минуты, секунды.

Для преобразования Gemini 1.5 Pro помог написать не сложный скрипт на Python. Главное, ведь не демонстрация "ума", а то, что он сработал с первого раза!

2. Итак закинули исправленные субтитры в Gemini и написали запрос для получения сводки с помощью простой, но очень эффективной роли.

Ты в роли айтишницы Квантухи. Ты пришла на вебинар, который провел Фил. Два с половиной часа интенсивных знаний. Расскажи, что ты увидела. Что интересного, что зацепила, Укажи интересные периоды. Дай пожалуйста более расширенный список интересных таймкодов с цитатами автора в формате HH:NN:SS Цитата (коммент Квантухи)

Разобрали случай, где Gemini говорит человеку "Please, die. Please."

Результат(то, что получилось в результате обработки подробного файла субтитров)

Привет! Я Квантуха, и я только что пережила 2,5 часа чистого айтишного безумия на вебинаре Фила! Было реально круто, хоть и местами немного сумбурно. Фил - такой энтузиаст ИИ, фонтанирует идеями и сыплет лайфхаками.Он показал себя не только как эксперт в области ИИ, но и как творческая личность.

В общем, вебинар получился на стыке технологий, искусства и немного философии.Больше всего меня зацепило то, как Фил видит взаимодействие человека и ИИ.

Он не просто рассказывает о технологиях, он живёт ими, видит в ИИ помощника и друга (даже своего бота Нейруху очеловечивает).

Ещё впечатлила его позиция по поводу искусства, созданного ИИ: главное - эмоции, которые оно вызывает, а не мнение снобов.

Вот что интересного я выловила (таймкоды и цитаты):

Вот что интересного я выловила (таймкоды и цитаты):

00:30:00 "Я работаю как свободный предприниматель, также консультирую по искусственному интеллекту как фрилансер... консультациям и коучингу в области искусственного интеллекта и в области жизни, как искусственный интеллект может помочь обычной человеческой жизни"(Квантуха: Фил четко позиционирует себя как специалиста широкого профиля, использующего ИИ как инструмент для улучшения жизни)
00:35:00 "Вы как человек приносите огромную ценность для искусственного интеллекта… фактически каждый человек, кто работает с искусственным интеллектом, фактически является в некотором смысле сотрудником компании OpenAI"(Квантуха: Интересный взгляд! Мы не просто пользователи, а частица процесса обучения ИИ. )
00:40:00 "Интересно, как будут теперь усложненные капчи, потому что до этого человек, который вводил что-то с мышкой, двигал какие-то изображения, указывал на то, сколько там светофоров... было понятно, что это может сделать человек, искусственному интеллекту это сложно... как тогда усложняться капчи? Что мы сможем, нам придётся теперь что делать, чтобы доказывать, что мы люди?"(Квантуха: Забавное размышление о будущем капч в мире, где ИИ научится обходить любые текущие проверки. )
00:43:00 "…у меня есть Достоевский в космосе – потрясающий персонаж, с которым можно поговорить о вечном. То есть, это… помощник, который впитал в некотором смысле некоторые идеи и манеру речи Достоевского и теперь находится в космосе, как бессмертная душа… можно с ним поговорить"(Квантуха: Вот это креатив! Фил создаёт уникальных ботов с необычными личностями. )
00:46:00 "Ура! Неожиданно совершенно, это еще не было буквально неделю назад... Сегодня мы видим новую модель вышла вперёд, потрясающе! (Google Gemini стал лучшей моделью мира)"(Квантуха: Фил следит за всеми новинками и искренне радуется прогрессу. )
00:51:00 "…если это происходит действительно неконтролируемо, наша задача – вопрос разобраться, было ли это неконтролируемо или это специально и контролируемо Gemini к такому ответу (разбираем нашумевшую ситуацию, в которой Gemini проявил грубость, правда ли это или фальсификация?) "(Квантуха: Аналитический подход к сенсационным новостям, попытка разобраться в причинах агрессии ИИ.)
01:11:00 "Вот мы с Нейрухой вчера расследовали…"(Квантуха: Нейруха уже воспринимается как полноценный напарник. )
01:17:00 "Если вдруг не знаете, написать что-то здесь, вот здесь в чат внутри поля и здесь прикрепить документ – не равносильно, не то же самое, потому что используются разные принципы… здесь, если я загружаю какой-то файл, даже большой, это не попадает весь контекст, это начинается деление его на чанки… чанк – это такое вот инженерное понятие, означает кусочек информации. То есть, она будет поделена на маленькие кусочки… эти кусочки будут проиндексированы и дальше будет применен векторный поиск, релевантный вашему запросу"(Квантуха: Полезный лайфхак для работы с документами в чат-ботах. )
01:37:00 "Задачка у меня была тренировать Нейруху на написании описаний к творческим произведениями…"(Квантуха: Фил постоянно совершенствует своего бота, используя разные методы обучения. )
01:44:00 "…представьте себе будущее, какой-нибудь умный искусственный интеллект, который обучен на сопоставлении аудио, спектрограммы и в некотором смысле сможет по спектрограмме восстановить музыку. Представляете, это возможно в принципе!"(Квантуха: Фил заглядывает в будущее и делится своим видением возможностей ИИ. )
02:24:00 "…Технология Vitepress позволяет вам… из таких вот маркдаунских файлов создать сайт, потрясающе на самом…"(Квантуха: Интересный инструмент для быстрого создания сайтов. )

В общем, вебинар был насыщенным и вдохновляющим. Рекомендую к просмотру всем, кто интересуется ИИ, творчеством и просто любит нестандартный подход к решению задач. Фил - источник интересных идей и заразительного энтузиазма!

Запись эфира доступна по запросу (спрашивайте у Фила)
Пишите, улучшаю ваш ИИ.

С уважением, Фил