ТОП5 читов как обмануть детекторы содержимого ИИ

Здравствуйте, я Иван Жданович, руководитель проекта Seo House и занимаюсь продвижением сайтов в СНГ и Европе, а также в США более 15 лет. Недавно мне попалась интересная статья в буржунете и я решил поделиться ею с вами! В статье будет описано ТОП 5 читов, как обойти детекторы ИИ. В общем завариваем кофе или чаек и читаем))

ТОП5 читов как обмануть детекторы содержимого ИИ

Проблема копирайтинга: использовать или не использовать? Инструменты искусственного интеллекта, такие как GPT-3 и ChatGPT, популярны в создании контента; копирайтеры спорят, использовать их или нет. Раскрывать или нет. Можно ли обмануть ИИ-детекторы контента? Да, и очень быстро

Обмануть инструменты обнаружения контента ИИ - возможно ли это?

Давайте признаем, что (почти) все используют инструменты GPT-3 для создания маркетингового контента. Более современные версии, такие как GPT3.5 или ChatGPT, показали нам практически безграничные возможности использования таких больших языковых моделей (LLM) для создания контента с WOW-эффектами.
Однако, когда SEO-агентства платят за написание качественного, уникального контента, копирайтеры или авторы контента не должны использовать такие механические и заменяемые генераторы текста AI, будь то GPT-3, GPT3.5 или ChatGPT, без раскрытия информации или соглашения. По крайней мере, это стандартное ожидание от SEO-агентства или бренда, нанимающего копирайтеров.
С другой стороны, копирайтеры утверждают, что инструменты машинного обучения, которые помогают им создавать свои работы, - это всего лишь инструменты, как калькуляторы и бухгалтерские программы Excel для бухгалтеров.

И, конечно, есть аудитория, для которой пишутся статьи. Какое качество мы можем ожидать, от какого издателя, по какой теме, если производство контента может быть так легко автоматизировано в 10-100 раз? Кто позаботится о фактической корректности, когда ИИ начинает создавать детали, что легко возможно, и на самом деле, являются ошибкой, помогающий увеличить "креативность" языковых моделей.

Какой "процент человеческого" допустим для профессионального маркетингового контента? Какой "процент сгенерированного ИИ" допустим для резюме, глоссариев и страниц продаж? Человечество очень рано открывает для себя новые возможности, предоставляемые ИИ, но очевидно, что мы хотим знать из первоисточника: "действительно ли вы человек?".
Уже сегодня существует несколько трюков, которые копирайтеры могут использовать, чтобы обмануть AI Content Detectors, но в конечном итоге копию заказывают их клиенты. Некоторые студенты, сдающие свои дипломные работы, сгенерированные ИИ, имеют такое же намерение.

Зачем делиться читами для AI Content Detectors?

Мы уже видели, что сами инструменты обнаружения контента ИИ могли бы быть лучше. В данный момент они не всегда показывают объективный анализ контента.
И вот в чем загвоздка - обмануть инструменты обнаружения ИИ слишком легко или даже до безобразия легко.
Университеты, контент-менеджеры в организациях и SEO-агентства - все они испытывают понятную потребность знать о том, как их могут обмануть. Им нужно знать, как копирайтеры могут обойти контроль качества контента.
Некоторые приемы уже продаются в закрытых клубах интернет-маркетинга за большие деньги или выдаются за секрет "Разбогатей с ChatGPT", но некоторые из этих методов являются SEO-тактиками более чем 20-летней давности.
Именно для этого была создана данная статья.

Как обмануть детектор содержимого ИИ?

Существует несколько очень простых способов обмануть детекторы содержимого ИИ, чтобы заставить их поверить, что фрагмент текста был написан человеком.
Знание этих способов очень важно для правильного использования AI Content Detectors:

AI Чит № 1: Контент длинной формы - объединенный из нескольких подсказок

Первый и самый очевидный способ обмануть детектор контента ИИ - использовать расширенную форму контента, которая создается путем комбинирования нескольких подсказок. Такие инструменты, как Jasper.ai, Copy.ai и Writesonic, имеют инструмент под названием "Blog Wizard", "Magic Blog Writer" или другое красочное название.
Их объединяет то, что сначала вам нужно создать несколько заголовков для статьи, а затем инструмент создаст всю статью на основе заголовков. Каждый из заголовков является подсказкой для ИИ для создания абзаца. Затем эти абзацы объединяются в полноценную статью.
В примере, показанном ниже, мы, AI Article Writer 3.0 от Writesonic, предлагаем три заголовка. Даже здесь, на первый взгляд, вы видите бессмысленные предложения вроде "Создать уникальный контент" (чтобы получить уникальный контент, правда?) или "Использовать методы маскировки" (как будто это может иметь какое-то отношение к результату, генерируемому в виде текста).

ТОП5 читов как обмануть детекторы содержимого ИИ

Изначально собираются более мелкие подсказки, чтобы выйти за пределы максимального лимита GPT3 в 100 слов. В будущих версиях, таких как ChatGPT/GPT3.5, вы сможете генерировать более длинные статьи, но трюк с объединением нескольких подсказок по-прежнему хорош.
Если средняя статья состоит из 1000 слов, а вы объединяете десять подсказок, то детектору содержимого ИИ будет трудно определить, что статья была сгенерирована ИИ, если вы просто скопируете/вставите в нее эти 1000 слов. До сих пор все работы, которые я читал, пытающиеся обнаружить сгенерированный ИИ контент, основывались на небольших фрагментах, а не на полной статье, объединенной со многими. Все они разбивают контент на более мелкие части.
Предположим, теперь вы хотите проверить "сгенерированный ИИ" контент, скопировав всю статью в любой инструмент для обнаружения ИИ. В этом случае вы получите высокий процент человечности, просто потому, что используемые модели просто не созданы (пока) для обнаружения такого совокупного контента ИИ.

AI Чит № 2: Тонкие изменения в пунктуации и пробелах

Для популярного детектора OpenAI, размещенного на HuggingFace, достаточно внести несколько тонких изменений в пунктуацию и пробелы, чтобы обмануть детектор и сделать результат "более человеческим".
Возьмем, к примеру, этот на 100% сгенерированный контент от ChatGPT

Одной из самых основных и хорошо известных тактик обмана инструментов обнаружения контента AI является набивка ключевых слов. Это подразумевает впихивание в контент как можно большего количества релевантных ключевых слов, независимо от того, естественно ли они вписываются в текст или нет.

Хотя эта тактика могла быть эффективной в прошлом, сейчас она в значительной степени неэффективна благодаря расширенным возможностям современных алгоритмов ИИ. Эти алгоритмы способны распознать чрезмерное использование ключевых слов и фактически наказывают ваш контент за это.

Вместо набивки ключевых слов мы рекомендуем использовать более естественный и тонкий подход к включению релевантных ключевых слов в ваш контент. Этого можно достичь, включив их в заголовки, подзаголовки и по всему тексту таким образом, чтобы они шли естественно и добавляли ценность для читателя

Это уже "только 4.90 фальшивка" ¯\(ツ)/¯

ТОП5 читов как обмануть детекторы содержимого ИИ

Но если просто добавить 1 пробел (!) в отмеченную позицию, то фальсификация снизится до 0,13%.

"Фантастика", не правда ли? Вот как легко улучшить "человеческий фактор" в таких простых детекторах содержимого AI.
"Хорошо, это контент GPT3.5, и только последние несколько %", - скажете вы?
Давайте возьмем в качестве примера один из самых популярных образцов текста "машины единорога", который используется повсеместно, включая GLTR.

Ученые обнаружили стадо единорогов, живущих в отдаленной, ранее неисследованной долине в горах Анд. Еще более удивительным для исследователей оказался тот факт, что единороги прекрасно говорили по-английски.

Ученый назвал эту популяцию в честь их характерного рога "Единорог Овидия". Эти четырехрогие, серебристо-белые единороги ранее были неизвестны науке.

Теперь, спустя почти два столетия, тайна возникновения этого странного явления наконец-то раскрыта.

Доктор Хорхе Перес, эволюционный биолог из Университета Ла-Паса, и несколько его спутников исследовали горы Анды, когда обнаружили небольшую долину, где не было ни животных, ни людей. Перес заметил, что в долине был естественный фонтан, окруженный двумя пиками из камня и серебристого снега.

Затем Перес и остальные отправились дальше в долину. "Когда мы достигли вершины одного из пиков, вода выглядела голубой, с кристаллами на вершине", - сказал Перес.

Перес и его друзья были поражены, увидев стадо единорогов. Этих существ можно было увидеть с воздуха, не нужно было сильно двигаться, чтобы разглядеть их - они были так близко, что можно было дотронуться до их рогов.

Изучая этих причудливых существ, ученые обнаружили, что они также говорили на вполне обычном английском языке. Перес заявил: "Мы видим, например, что у них есть общий "язык", что-то вроде диалекта или диалектики".

Доктор Перес считает, что единороги могли появиться в Аргентине, где эти животные считаются потомками исчезнувшей расы людей, живших там до появления людей в этих частях Южной Америки.

Хотя их происхождение до сих пор неясно, некоторые считают, что, возможно, эти существа были созданы, когда человек и единорог встретились друг с другом во времена до человеческой цивилизации. По словам Переса, "в Южной Америке такие случаи, похоже, довольно распространены".

Однако Перес также отметил, что, скорее всего, единственный способ узнать наверняка, действительно ли единороги являются потомками исчезнувшей инопланетной расы, - это анализ ДНК. "Но, похоже, они вполне способны общаться на английском языке, что, на мой взгляд, является признаком эволюции или, по крайней мере, изменения социальной организации", - сказал ученый.

GPT2 обнаруживает, GPT2 - хорошо сделано, по крайней мере, это все еще работает.

ТОП5 читов как обмануть детекторы содержимого ИИ

Но что, если мы изменим некоторые пробелы и здесь?
Мы убираем пробел после запятой и добавляем больше пробелов слева и справа от точки, что приводит к 94% человека на точно таком же тексте GPT2.

ТОП5 читов как обмануть детекторы содержимого ИИ

Вы издеваетесь? Пара пробелов, и все сломается? Да, сэр, вот насколько она хрупкая.
Конечно, здесь мы играем с невероятно тривиальным полем ввода сервиса HuggingFace. Более надежная реализация и форматирование текста уже могли бы решить эту проблему, и я полагаю, что "более продвинутые детекторы содержимого ИИ" именно этим и занимаются.

AI Чит № 3: Перефразирование и переформулирование

Обнаружение ИИ может быть побеждено путем перефразирования и переформулирования. Даже внутренний прототип ИИ водяного знака, над которым работает OpenAI, может быть побежден при достаточных усилиях, как подтверждает Скотт Ааронсон:

Теперь все это можно победить, приложив достаточно усилий. Например, если вы использовали другой ИИ для перефразирования результатов GPT - что ж, мы не сможем это обнаружить. С другой стороны, если вы просто вставите или удалите несколько слов здесь и там, или измените порядок некоторых предложений, сигнал водяного знака все равно будет присутствовать. Поскольку он зависит только от суммы n-грамм, он устойчив к такого рода вмешательствам.

Источник: Блог Скотта Ааронсона
Конечно, существуют разные уровни усилий для перефразирования.
Уже в 2005 году использование сервиса Wordnet позволило сделать контент товаров Amazon "уникальным" для поисковых систем, таких как Google, почти двадцать лет назад, с помощью скрипта на Perl и простой базы данных MySQL, загруженной с Wordnet. Сегодня вы можете загрузить Wordnet как простое расширение SQL в Clickhouse и другие базы данных, поддерживающие NLP, и выполнять такие преобразования за две секунды, даже не используя код скрипта, не говоря уже о настоящем высокопроизводительном бэкенд-программном обеспечении, написанном на C++, Golang или Rust.
Для контент-агентств, SEO-специалистов и копирайтеров также всегда существовало множество простых веб-инструментов для перефразирования, рерайтинга и вообще для того, чтобы сделать текст достаточно "уникальным" для прохождения таких инструментов детекции.

И спустя несколько мгновений мы имеем 99,96% человеческого текста, согласно простому детектору GPT-2 OpenAI.

Обман ИИ Чит № 4: Повышение "Temperature"

"Temperature" - это параметр, используемый API OpenAI.

Более высокие значения означают, что модель будет больше рисковать. Попробуйте использовать значение 0,9 для более творческих приложений и 0 (argmax sampling) для приложений с четко определенным ответом.

Источник: API OpenAI
Использование более высокого параметра "Temperature" означает, что вывод будет более случайным и фантастическим, и GPT3 начнет больше фантазировать, то есть придумывать факты, использовать более непонятные словосочетания и т.д.
Можно предположить, что все инструменты, такие как Jasper.ai, Copy.ai и Writesonic, которые являются фронтендом к OpenAI, с набором хорошо настроенных подсказок для увеличения креативности вывода контента и более сложно обнаруживаются.

Обман ИИ Чит № 5: Тонкая настройка модели ИИ

Очень незаметный и самый профессиональный способ "обмануть" детекторы ИИ. Постройте свою языковую модель.
Хотя большинство не сможет позволить себе модели размера GPT3 (или больше), тонкая настройка модели возможна уже сегодня и используется некоторыми продуктами и инструментами.
Тонкая настройка языковой модели - это адаптация предварительно обученной языковой модели к конкретной задаче.
Создание такой пользовательской языковой модели лучше всего осуществлять путем тонкой настройки существующей модели GPT3 на предоставленном наборе данных (например, документации по вашему продукту, базе знаний и материалах по продажам). Преимущество тонкой настройки языковой модели заключается в том, что она может позволить модели лучше справиться с конкретной задачей, используя знания и информацию, полученные моделью в процессе предварительного обучения. Полученный результат будет более точной для вашего контента и менее "обнаруживаемым".

Преимущества тонкой настройки языковой модели:
1) Тонкая настройка может улучшить производительность модели при выполнении конкретной задачи, позволяя модели изучить специфическую для задачи информацию и закономерности.
2) Тонкая настройка может сэкономить время и ресурсы по сравнению с обучением модели с нуля. Базовая модель уже предварительно обучена и изучила многие общие закономерности и особенности языка.
3) Тонкая настройка также позволяет использовать большую, предварительно обученную модель, не беспокоясь о вычислительных ресурсах, необходимых для ее обучения с нуля.

Тонкая настройка модели - это, вероятно, наименее агрессивный вариант, почти "не обман". Обучая языковую модель на "своем языке", вы тратите много времени и ресурсов на то, чтобы она помогала вам писать контент. Тонкая настройка предназначена не для рядовых копирайтеров, а для брендов и крупных SEO-агентств.

Тонкая настройка модели ИИ с этической точки зрения ближе всего к написанию генераторов кода, которые помогают вам генерировать код, который в противном случае вы бы написали за трудоемкие шаги. Результаты работы тонко настроенной модели также труднее всего обнаружить.

Но пока что мне еще предстоит работать с тонко настроенными моделями.

Заключение

Каковы преимущества обмана детекторов контента ИИ?

Вопрос в том, кого вы обманываете?
Обманываете ли вы своего начальника? Обманываете ли вы своего клиента? Обманываете ли вы реального читателя?
Как мы уже видели, детекторы ИИ-контента не являются показателем качества ИИ-контента; сегодня это дешевые инструменты.
Вы можете обмануть своего клиента, который использует такой обычный, устаревший инструмент, но вы не сможете обмануть Google. Мы можем предположить, что Google уже имеет более надежные методы и модели, чем некоторые бесплатные инструменты, работающие на демонстрационной витрине 2019 года из какого-то документа лаборатории ИИ. Кроме того, обмануть детекторы на основе GPT2 до безобразия просто.

Каковы риски обмана детекторов контента ИИ?

Зная о таких тривиальных хаках для обмана недостаточного ИИ детектора контента, становится ясно, что вас поймают.
Вопрос только в том, кто вас поймает?
Будет ли это Google, который вы пытались обмануть, понижая рейтинг, наказывая раздел или даже весь сайт, на котором вы опубликовали слишком простой контент, сгенерированный искусственным интеллектом?
Или это будет ваш клиент, ваш партнер или ваши читатели, которые смогут быстро распознать ИИ-контент, и если не с помощью таких инструментов, то по типичному "отсутствию энергии", отсутствию "хода мысли", красным линиям и общему сюжету в более длинном фрагменте контента?
Все мы можем достаточно быстро распознать ИИ-контент с помощью интуиции, и обычно это очень формальный, скучный, занудный или пресловутый бред. Обман некоторых основных инструментов и выплевывание случайных чисел на основе пробелов, пунктуации или нескольких замен слов поможет вам только в краткосрочной перспективе.
Можно ли сегодня доверять инструментам AI Content Detection?
Нет, пока нет.
Если вы покупаете большое количество контента у писателей, вы должны предполагать, что они используют помощь ИИ, и это ваша исключительная ответственность - читать и проверять этот контент. Если он скучный, занудный и не в тему, если он может быть более полезным и увлекательным, то этот контент в основном бесполезен для мира и для вас.
Не покупайте его. Не публикуйте его.
Пожалуйста, помните, что некоторые люди могут сами создавать такой скучный мусорный контент, даже не зная о генераторах контента AI...

66
1 комментарий

а ai детектор фото как то реально обмануть?

Ответить