Мы как раз занимаемся ИИ в сфере Интерпретируемых моделей, этот классификатор в принципе и есть модель объясняющая по каким фичам текст является сгенерированным, просто нам их не покажут.
Но т.к. мы сами разрабы и знаем дыры ChatGPT то можно сказать что там будет дело в распределении фактов на удельную единицу (скажем предложение) - у ЧатГПТ насыщение фактами низкое - поэтому простой способ детектить это выделять NER в тексте и его связи.
Обойти детектор можно, но нужно будет обучить свою модель с улучшенной фактологией, скорее всего гибридную. Дело в том, что если учить тот же InstructGPT даже большой, то все равно основной концепт фич(фактология) останется неизменным - их балансная статистика в общей массе. Поэтому на само деле для обхода потребуется приложить усилия, чтобы этот обход стал статистически значимым.
А потом выпустят бота, который будет проверять на правдивость ответы ботов, которые проверяют написал ли текст бот или человек. (типа, своих не сдаёт..)
Ожидание научил, способен отличить текст…Реальность с точностью 26%. В 9% случаев он неверно определял текст, созданный человеком, как сгенерированный.
А потом выпустит апдейт для ChatGPT, который научит его обходить детектор.
Напоминает АОН и АНТИАОН
Иф ю ноу вот ай мин
Мы как раз занимаемся ИИ в сфере Интерпретируемых моделей, этот классификатор в принципе и есть модель объясняющая по каким фичам текст является сгенерированным, просто нам их не покажут.
Но т.к. мы сами разрабы и знаем дыры ChatGPT то можно сказать что там будет дело в распределении фактов на удельную единицу (скажем предложение) - у ЧатГПТ насыщение фактами низкое - поэтому простой способ детектить это выделять NER в тексте и его связи.
Обойти детектор можно, но нужно будет обучить свою модель с улучшенной фактологией, скорее всего гибридную. Дело в том, что если учить тот же InstructGPT даже большой, то все равно основной концепт фич(фактология) останется неизменным - их балансная статистика в общей массе.
Поэтому на само деле для обхода потребуется приложить усилия, чтобы этот обход стал статистически значимым.
А потом выпустят бота, который будет проверять на правдивость ответы ботов, которые проверяют написал ли текст бот или человек. (типа, своих не сдаёт..)
Скорее выпустят свой Adblock, который будет убирать тексты написанные ИИ
уже ничем не удивлюсь если честно
Ожидание
научил, способен отличить текст…Реальность
с точностью 26%. В 9% случаев он неверно определял текст, созданный человеком, как сгенерированный.