OpenAI выпустил инструмент для выявления текстов, написанных ИИ Статьи редакции

Точность его работы повышается по мере увеличения длины текста.

  • Компания рассказала, что создала классификатор, который способен отличить текст, написанный человеком, от текста, сгенерированного нейросетью. Он должен помочь выявлять использование ИИ для распространения дезинформации или злоупотреблений в сфере образования.
  • Классификатор представляет собой языковую модель, обученную на парах из текстов, созданных человеком и сгенерированных ИИ. Для этого запросы к нейросетям формулировались в соотвествии с темами текстов, написанных людьми.
  • OpenAI предупреждает, что инструмент не полностью надёжен, и рекомендует использовать его только для материалов на английском языке. Во время тестов классификатор определял тексты, написанные ИИ, с точностью 26%. В 9% случаев он неверно определял текст, созданный человеком, как сгенерированный.
  • Точность работы классификатора повышается по мере увеличения объёма проверяемого текста. Его надёжность при проверки маленьких текстов (меньше тысячи знаков) будет низкой. Он также может выдать ложный результат при проверке отредактированного человеком текста.
«Экзамен сдал, но на троечку»: как чат-бот ChatGPT пытался выпуститься из университетов Статьи редакции

Спойлер: с трудом. Но учёные отмечают, что с простыми вопросами он справляется не хуже студентов.

Источник: Showmetech
0
101 комментарий
Написать комментарий...
Антон Большаков

А потом все удивляются, почему колличество информации в мире растет в геометрической прогрессии ))
Теперь колличество мусорной информации будет расти в разы больше.

Ответить
Развернуть ветку
ЯжПрограммист

Как раз идея в том, чтобы перестать хранить 100500 статей и текстов на одну и ту же тему, используя поиск в этой куче мусора, а получить текст на нужную тему по запросу. Идея как с 3д принтером, который будет создавать нужные вещи на месте из каких-то типовых исходных материалов. Фактически шаг в сторону постмодерна.

Ответить
Развернуть ветку
Антон Большаков

Возможно идея хорошая, но глядя на тот хайп, который сейчас происходит вокруг этих нейронок (генерация кучи статей, картинок и т.д.) говорит об обратном.
Только представь, какой объем информации, нагенерировали с помощью тех же Midjourney и Stable Diffusion за последние пару месяцев. Просто из воздуха, генерируют терабайты информации.
Мало того, помимо генерации такого объема информации, еще и забиваются и без того перегруженные магистральные каналы по передаче данных.
Так что я пока скорее против такого активного внедрения этих технологий.
Что касается сравнения с 3Д принтером, то это не совсем корректно. 3Д принтер печатает не из воздуха, а из пластика/металла и т.д. Он не создает что-то из ничего, а просто формирует raw материал в форму.

Ответить
Развернуть ветку
ЯжПрограммист

Хайп вокруг всего нового будет, это нормальная история. Люди массово исследуют возможности применения и в конечном итоге устаканятся необходимые ниши, а всё остальное останется в прошлом. Информация генерится не их воздуха, а из исходных знаний, фактически сегодня под информацией мы понимаем 100500 статей которые переливают из пустого в порожнее одно и тоже. Т.е. "фабрики контента" типа сайтов habr, lifehacker и многих других больше не будет, будут только новостные ресурсы, научные статьи (не пресказ оных, а именно те которые отвечают со здание новых знаний и теорий).

Ответить
Развернуть ветку
98 комментариев
Раскрывать всегда