OpenAI выпустил инструмент для выявления текстов, написанных ИИ Статьи редакции

Точность его работы повышается по мере увеличения длины текста.

  • Компания рассказала, что создала классификатор, который способен отличить текст, написанный человеком, от текста, сгенерированного нейросетью. Он должен помочь выявлять использование ИИ для распространения дезинформации или злоупотреблений в сфере образования.
  • Классификатор представляет собой языковую модель, обученную на парах из текстов, созданных человеком и сгенерированных ИИ. Для этого запросы к нейросетям формулировались в соотвествии с темами текстов, написанных людьми.
  • OpenAI предупреждает, что инструмент не полностью надёжен, и рекомендует использовать его только для материалов на английском языке. Во время тестов классификатор определял тексты, написанные ИИ, с точностью 26%. В 9% случаев он неверно определял текст, созданный человеком, как сгенерированный.
  • Точность работы классификатора повышается по мере увеличения объёма проверяемого текста. Его надёжность при проверки маленьких текстов (меньше тысячи знаков) будет низкой. Он также может выдать ложный результат при проверке отредактированного человеком текста.
«Экзамен сдал, но на троечку»: как чат-бот ChatGPT пытался выпуститься из университетов Статьи редакции

Спойлер: с трудом. Но учёные отмечают, что с простыми вопросами он справляется не хуже студентов.

Источник: Showmetech
0
101 комментарий
Написать комментарий...
Rha

А потом выпустит апдейт для ChatGPT, который научит его обходить детектор.

Ответить
Развернуть ветку
Александр Ковалев

Напоминает АОН и АНТИАОН
Иф ю ноу вот ай мин

Ответить
Развернуть ветку
18 комментариев
Виктор Н. (FractalGPT)

Мы как раз занимаемся ИИ в сфере Интерпретируемых моделей, этот классификатор в принципе и есть модель объясняющая по каким фичам текст является сгенерированным, просто нам их не покажут.

Но т.к. мы сами разрабы и знаем дыры ChatGPT то можно сказать что там будет дело в распределении фактов на удельную единицу (скажем предложение) - у ЧатГПТ насыщение фактами низкое - поэтому простой способ детектить это выделять NER в тексте и его связи.

Обойти детектор можно, но нужно будет обучить свою модель с улучшенной фактологией, скорее всего гибридную. Дело в том, что если учить тот же InstructGPT даже большой, то все равно основной концепт фич(фактология) останется неизменным - их балансная статистика в общей массе.
Поэтому на само деле для обхода потребуется приложить усилия, чтобы этот обход стал статистически значимым.

Ответить
Развернуть ветку
3 комментария
Михаил Затолокин

А потом выпустят бота, который будет проверять на правдивость ответы ботов, которые проверяют написал ли текст бот или человек. (типа, своих не сдаёт..)

Ответить
Развернуть ветку
15 комментариев
Денис Демидов

Скорее выпустят свой Adblock, который будет убирать тексты написанные ИИ

Ответить
Развернуть ветку
3 комментария
Роман Славутин

уже ничем не удивлюсь если честно

Ответить
Развернуть ветку
Невероятный Блондин

Ожидание

научил, способен отличить текст…

Реальность

с точностью 26%. В 9% случаев он неверно определял текст, созданный человеком, как сгенерированный.
Ответить
Развернуть ветку
Николаус Корнев

Пока что подбрасывание монеты лучше обучено определять сгенерированный текст, там вероятность 50%

Ответить
Развернуть ветку
3 комментария
Кубик Рубика

ты ИИ,нет ты ИИ,нет я человек

Ответить
Развернуть ветку
High Stakes
Ответить
Развернуть ветку
Вадим Д.

Новый уровень антиплагиата?
Умно 😏

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
3 комментария
Борис Фёдоров

а лично вы, не будете ощущать дискомфорт, с новым антиплагиатом?

Ответить
Развернуть ветку
Антон Большаков

А потом все удивляются, почему колличество информации в мире растет в геометрической прогрессии ))
Теперь колличество мусорной информации будет расти в разы больше.

Ответить
Развернуть ветку
Vladislav P

А кстати да, интересная мысль. Где же мы все это будем хранить через пару лет?

Чую надвигается мировой кризис, такой же как с микрочипами, только теперь с памятью. Уже можно покупать акции компаний производящие накопители?🤔

Ответить
Развернуть ветку
3 комментария
ЯжПрограммист

Как раз идея в том, чтобы перестать хранить 100500 статей и текстов на одну и ту же тему, используя поиск в этой куче мусора, а получить текст на нужную тему по запросу. Идея как с 3д принтером, который будет создавать нужные вещи на месте из каких-то типовых исходных материалов. Фактически шаг в сторону постмодерна.

Ответить
Развернуть ветку
2 комментария
Пёс-С-Уткой

перечитываем "Страж-птица".

https://ru.wikipedia.org/wiki/Страж-птица

Ответить
Развернуть ветку
Вадим Д.

Почти наизусть помню. Надеюсь, на нашем веку чатГПТ разные в системы управления и безопасности бесконтрольно не внедрят.

Ответить
Развернуть ветку
3 комментария
Невероятный Блондин

Надо же, не читал, теперь придется.

Судя по вики, это черное зеркало.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Вася Пражкин
Во время тестов классификатор определял тексты, написанные ИИ, с точностью 26%.

Ну тут даже не 50/50..

Ответить
Развернуть ветку
Dimitri

Безконечная гонка ИИ начинается, как в свое время с антивирусами. Сейчас выйдет 100500 ИИ сервисов которые будут переписывать тексты ChatGPT и тд, что бы их не распознавал ИИ детектор.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Вяйняймейнен Уленшпигель

Через 10 лет сможем ИИ имплементировать напрямую в мозг, так что обычный можно уже бросать.

Ответить
Развернуть ветку
2 комментария
Дмитрий Рявкин

Если детектить по количеству "воды" в тексте, то что создал ИИ мало будет отличаться от речи политиков/инфоциган/....

кстати интересно проверить

Ответить
Развернуть ветку
Иван Помнящий

Так уже на vc стали статьи от нейросететей выкладывать, их сразу видно по стилю и обилию воды

Ответить
Развернуть ветку
1 комментарий
Михаил Барабаш

Поединок меча и щита разгорается в новой сфере

Ответить
Развернуть ветку
Vladislav P

Хех, я ждал этой новости. Следующую новость жду такую: Создали ИИ чтобы маскировать текст сгенерированный ИИ от другой ИИ. Да начнется великая битва!
Даю неделю, чтобы такая новость появилась🤣

Ответить
Развернуть ветку
Genby

У человечества 100500 насущных проблем включая голод в Африке, а мы все еще решаем несуществующие проблемы.

Ответить
Развернуть ветку
4 комментария
СарыньНаКичку

антиплагиАД

Ответить
Развернуть ветку
Александр Ничипоренко

Ну, всё. Расходимся.

Ответить
Развернуть ветку
Андрей Герцен

Выстрел себе в ногу

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Слегка Придурковатый

"с точностью 26%"

Старая добрая монетка круче этого инструмента.

Ответить
Развернуть ветку
Mike Wozowoy

Создание подразделений блейд раннеров на подходе

Ответить
Развернуть ветку
Vladislav R

Это гуглу как никому другому нужен такой классификатор. И 26% точность не кажется значимым результатом

Ответить
Развернуть ветку
Genby

Вадим Д, нервно курит в сторонке.

Ответить
Развернуть ветку
Антон

Это уже востребованно

Ответить
Развернуть ветку
Dim Entelis
Во время тестов классификатор определял тексты, написанные ИИ, с точностью 26%

Мне кажется подбрасывание монетки дает точность раза в 2 выше...

Ответить
Развернуть ветку
Зубр

полезное введение , спасибо

Ответить
Развернуть ветку
Evgeny

Пчелы против мёда. Рок против наркотиков. Кому что ближе.

Ответить
Развернуть ветку
Мэттью Грин

В моем материале есть то, что упустил автор этой публикации. https://vc.ru/services/597260-chatgpt-razoblachitel-novyy-servis-ot-openai

Ответить
Развернуть ветку
Melissa Mata

Идея неплохая, но очень бы хотелось получить инструмент для маленьких текстов... Ботов хочу в комментариях вычислять. Пока что пользуюсь собственными ответами. Пишу ахинею - если её подхватывают: значит - бот.

Ответить
Развернуть ветку
98 комментариев
Раскрывать всегда