«Да я честно сам писал!» − как распознать ИИ в тексте научной работы

«Да я честно сам писал!» − как распознать ИИ в тексте научной работы

Целевая аудитория этой статьи – редакторы, преподаватели, научные руководители и все, кому приходится по долгу службы иметь дело с курсовыми, дипломными и другими учебными и научными текстами.

Представим ситуацию − студент сдал работу, вы прогоняете ее через систему «Антиплагиат» и она выдает большой восклицательный знак, предупреждая, что в работе есть подозрительный фрагмент текста, который возможно был написан с помощью сервисов искусственной генерации текста. Но… наверняка, к сожалению, знать нельзя. Такая отметка не дает прямых оснований отклонить работу или не допустить студента к защите. Она лишь уведомляет, что к тексту стоит присмотреться внимательнее, а окончательное решение остается за вами.

Рассказываем, как не оказаться «плохим парнем» в жизни честного студента и, что еще хуже, в своей собственной.

Алгоритм действий такой: при появлении пометки о наличии сгенерированного текста необходимо побеседовать со студентом, чтобы оценить, владеет ли он материалом, и провести дополнительный анализ текста. Уверены, что с беседой вы справитесь самостоятельно, а вот с анализом поможем мы.

Как система «Антиплагиат» распознает ИИ тексты

Немного о самом детекторе машинно сгенерированных текстов в системе «Антиплагиат». Он работает на основе алгоритмов искусственного интеллекта, обучен и протестирован на большом массиве данных. Это сводит к минимуму риск ложного срабатывания.

Наша система обработала колоссальное количество текстов, чтобы научиться определять искусственно созданные фрагменты. В основе этой функции лежит ряд признаков, свойственных искусственно сгенерированным текстам. Невооруженным глазом эти признаки распознать невозможно, тем не менее у ИИ текстов есть и другие особенности, которые выдают их. И, если знать, что искать, их вполне можно распознать самостоятельно. Именно это мы и научим вас делать.

Теперь к главному, показываем на реальных примерах характерные признаки искусственно сгенерированных текстов

Искусственный интеллект пишет тексты, которые могут выглядеть очень правдоподобно, наукообразно и иметь высокий процент оригинальности. При этом, если вчитаться повнимательнее, можно найти признаки, которые выдадут искусственного создателя с головой.

1. Бессмысленные фразы:

  • «Маркетинговые коммуникации представляют собой совокупность усилий компании по созданию благоприятных условий для успешной и прибыльной деятельности на рынке, посредством воздействия на ее внутреннюю и внешнюю среду».
  • «В этом можно увидеть ряд основных принципов: цель, способ и способы достижения цели».
  • «Введение диплома по анализу и совершенствования управления организацией, является важнейшим компонентом, который задает контекст и цель для всего исследования».

2. Искаженные словосочетания, термины или клише¹.

«Да я честно сам писал!» − как распознать ИИ в тексте научной работы

3. Странно написанные устоявшиеся определения. Это обычно говорит об использовании ИИ для перефразирования чужого текста.

«Да я честно сам писал!» − как распознать ИИ в тексте научной работы

4. Почти дословные повторы одной и той же мысли.

«Да я честно сам писал!» − как распознать ИИ в тексте научной работы

5. Фейковые ссылки или полное отсутствие ссылок на источники даже в тех случаях, когда из текста следует явная необходимость ссылок. Например: «многие исследователи пишут о…» или «существует ряд исследований…» и т.д.

6. Фактические ошибки, ложная информация, фейковые факты.

7. Фразы, которые проникли в текст из диалога с ботом:

  • «Сгенерировать ответ заново»
  • «Как большая языковая модель, я…»
  • «На момент моего последнего обновления знаний в сентябре 2023 года…»³

Если в работе нашлось сразу несколько таких признаков, вероятнее всего ее написали с помощью генеративных сервисов. Да, неоспоримых доказательств привести нельзя, но в любом случае указанные признаки говорят о крайне низком качестве текста. Такую работу вполне оправданно можно отклонить и отправить на доработку студенту по причине несоответствия требованиям вуза к ВКР.

Если же текст работы соответствует требованиям вуза, и студент демонстрирует полноценное владение материалом, то вы можете снять отметку о подозрительности вручную с соответствующим комментарием.

Более подробную и техническую инструкцию можно посмотреть тут: https://antiplagiat.ru/wp-content/uploads/2023/06/ai_memo_2023.pdf

_______________________________________

¹ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: https://arxiv.org/pdf/2107.06751

² Гольдман И.Я., Добробабенко Н.С. Практика рекламы. Десять уроков для советского бизнесмена: Учебник [Текст]. – Новосибирск: СП Интербук, 1991. – 73 с.

³ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: arxiv.org/pdf/2107.06751

22
6 комментариев

Вспоминаю свою работу. Тогда было проще, ИИ не было. Были диски на Горбушке "1000000 рефератов, курсовых и дипломных" На мой взгляд принципы проверки на антиплагиат некорректные, т.к. проверяется вся работа целиком, в т.ч. справочные материалы. Эти фрагменты вообще нельзя брать в качестве объекта проверки - т.к. это справочные материалы - они во всем мире пишутся и читаются ОДИНАКОВО. Что там можно своего придумать-то?

Каждому последующему поколению будет сложнее и сложнее писать "уникальные" работы.

Я ХЗ в чем проблема использования ИИ при создании работы. Ее же все равно нужно прочитать, скорректировать, и хотя бы понимать, чтобы защититься. ИИ дает быстрый ответ на вопрос.

Я сына научил при помощи ИИ уроки делать - он оценил. Одно условие - проверять, читать и вникать, что она выдала.

Были бы в мое время такие технологии - я бы круглым отличником был, с кучей свободного времени!

1

хм... ну если главная цель получения образования быть круглым отличником с кучей свободного времени, то да

2

Максим, справочные материалы, список литературы и титульный лист отключаются в системе "Антиплаигат", их, конечно, не нужно проверять на плагиат.