OpenAI выпустил инструмент для выявления текстов, написанных ИИ Статьи редакции
Точность его работы повышается по мере увеличения длины текста.
- Компания рассказала, что создала классификатор, который способен отличить текст, написанный человеком, от текста, сгенерированного нейросетью. Он должен помочь выявлять использование ИИ для распространения дезинформации или злоупотреблений в сфере образования.
- Классификатор представляет собой языковую модель, обученную на парах из текстов, созданных человеком и сгенерированных ИИ. Для этого запросы к нейросетям формулировались в соотвествии с темами текстов, написанных людьми.
- OpenAI предупреждает, что инструмент не полностью надёжен, и рекомендует использовать его только для материалов на английском языке. Во время тестов классификатор определял тексты, написанные ИИ, с точностью 26%. В 9% случаев он неверно определял текст, созданный человеком, как сгенерированный.
- Точность работы классификатора повышается по мере увеличения объёма проверяемого текста. Его надёжность при проверки маленьких текстов (меньше тысячи знаков) будет низкой. Он также может выдать ложный результат при проверке отредактированного человеком текста.
8421
просмотров
А потом выпустит апдейт для ChatGPT, который научит его обходить детектор.
Напоминает АОН и АНТИАОН
Иф ю ноу вот ай мин
Мы как раз занимаемся ИИ в сфере Интерпретируемых моделей, этот классификатор в принципе и есть модель объясняющая по каким фичам текст является сгенерированным, просто нам их не покажут.
Но т.к. мы сами разрабы и знаем дыры ChatGPT то можно сказать что там будет дело в распределении фактов на удельную единицу (скажем предложение) - у ЧатГПТ насыщение фактами низкое - поэтому простой способ детектить это выделять NER в тексте и его связи.
Обойти детектор можно, но нужно будет обучить свою модель с улучшенной фактологией, скорее всего гибридную. Дело в том, что если учить тот же InstructGPT даже большой, то все равно основной концепт фич(фактология) останется неизменным - их балансная статистика в общей массе.
Поэтому на само деле для обхода потребуется приложить усилия, чтобы этот обход стал статистически значимым.
А потом выпустят бота, который будет проверять на правдивость ответы ботов, которые проверяют написал ли текст бот или человек. (типа, своих не сдаёт..)
Скорее выпустят свой Adblock, который будет убирать тексты написанные ИИ
уже ничем не удивлюсь если честно
Ожидание
научил, способен отличить текст…Реальность
с точностью 26%. В 9% случаев он неверно определял текст, созданный человеком, как сгенерированный.Пока что подбрасывание монеты лучше обучено определять сгенерированный текст, там вероятность 50%
ты ИИ,нет ты ИИ,нет я человек
Новый уровень антиплагиата?
Умно 😏
Жаль, что твой комментарий такой короткий.
а лично вы, не будете ощущать дискомфорт, с новым антиплагиатом?
А потом все удивляются, почему колличество информации в мире растет в геометрической прогрессии ))
Теперь колличество мусорной информации будет расти в разы больше.
А кстати да, интересная мысль. Где же мы все это будем хранить через пару лет?
Чую надвигается мировой кризис, такой же как с микрочипами, только теперь с памятью. Уже можно покупать акции компаний производящие накопители?🤔
Как раз идея в том, чтобы перестать хранить 100500 статей и текстов на одну и ту же тему, используя поиск в этой куче мусора, а получить текст на нужную тему по запросу. Идея как с 3д принтером, который будет создавать нужные вещи на месте из каких-то типовых исходных материалов. Фактически шаг в сторону постмодерна.
перечитываем "Страж-птица".
https://ru.wikipedia.org/wiki/Страж-птица
Почти наизусть помню. Надеюсь, на нашем веку чатГПТ разные в системы управления и безопасности бесконтрольно не внедрят.
Надо же, не читал, теперь придется.
Судя по вики, это черное зеркало.
Комментарий удален модератором
Ну тут даже не 50/50..
Безконечная гонка ИИ начинается, как в свое время с антивирусами. Сейчас выйдет 100500 ИИ сервисов которые будут переписывать тексты ChatGPT и тд, что бы их не распознавал ИИ детектор.
хватит развивать ИИ, мы еще обычный интелект развить не можем)))
Через 10 лет сможем ИИ имплементировать напрямую в мозг, так что обычный можно уже бросать.
Если детектить по количеству "воды" в тексте, то что создал ИИ мало будет отличаться от речи политиков/инфоциган/....
кстати интересно проверить
Так уже на vc стали статьи от нейросететей выкладывать, их сразу видно по стилю и обилию воды
Поединок меча и щита разгорается в новой сфере
Хех, я ждал этой новости. Следующую новость жду такую: Создали ИИ чтобы маскировать текст сгенерированный ИИ от другой ИИ. Да начнется великая битва!
Даю неделю, чтобы такая новость появилась🤣
У человечества 100500 насущных проблем включая голод в Африке, а мы все еще решаем несуществующие проблемы.
антиплагиАД
Ну, всё. Расходимся.
Выстрел себе в ногу
прям как юристы — создают людям проблемы, а потом их успешно решают за деньги 😁
Психи тестируют психиаторов. Или наоборот
"с точностью 26%"
Старая добрая монетка круче этого инструмента.
Создание подразделений блейд раннеров на подходе
Это гуглу как никому другому нужен такой классификатор. И 26% точность не кажется значимым результатом
Вадим Д, нервно курит в сторонке.
Это уже востребованно
Мне кажется подбрасывание монетки дает точность раза в 2 выше...
полезное введение , спасибо
Пчелы против мёда. Рок против наркотиков. Кому что ближе.
В моем материале есть то, что упустил автор этой публикации. https://vc.ru/services/597260-chatgpt-razoblachitel-novyy-servis-ot-openai
Идея неплохая, но очень бы хотелось получить инструмент для маленьких текстов... Ботов хочу в комментариях вычислять. Пока что пользуюсь собственными ответами. Пишу ахинею - если её подхватывают: значит - бот.