Humanizer-RU v2.1: детекторы поумнели, пришлось догонять

Что изменилось в детекции

Детекторы типа DivEye, Fast-DetectGPT, PIFE - плевать хотели на отдельные слова. Они смотрят на статистику последовательности предложений.

Что конкретно? Равномерность. AI раскладывает информацию ровным слоем: каждое предложение примерно одинакового «веса», переходы плавные, слова самые вероятные. Музак в текстовом виде. Человек пишет иначе. Три факта подряд, потом пауза. Отступление в скобках. Короткий вопрос. Удар цифрой.

Команда DivEye (2025) это формализовала. «Кардиограмма» текста, график колебаний неожиданности по предложениям, оказалась самым мощным разделителем. Вторые производные surprisal дают 39.4% вклада в детекцию. Больше, чем любой другой тип фич.

Контрастное вычитание

Есть исследование CoPA (EMNLP 2025) с красивой идеей. Вместо того чтобы вычёркивать маркеры по чеклисту, в каждом предложении найди самое предсказуемое слово. И замени его.

«Нашли решение проблемы» превращается в «Нашли лазейку». Или «костыль». Зависит от автора. Одна такая замена на предложение бьёт сильнее, чем три стилистические правки. У CoPA: 57.7% улучшения против Fast-DetectGPT, смысл сохраняется на 90%+.

Мы воткнули это в Шаг 3 скилла, сразу после удаления HARD BANS.

Информационный ритм

Два новых паттерна в каталоге.

Равномерная плотность (43). AI выдаёт предложения одинакового «веса». Скилл теперь требует чередовать: плотный абзац с цифрами, потом лёгкая ремарка, потом вопрос, снова плотный. Кардиограмма должна дёргаться.

Гладкие переходы (44). AI клеит каждое предложение к предыдущему через «Кроме того», «Также», «Не менее важным». Скилл теперь допускает 20-30% жёстких склеек, где связь не через союз, а через контекст. Читатель сам догадается.

Светофорная разметка

TH-Bench (2025) прогнали 6 типов атак через 13 детекторов на 19 доменах. Вывод: нельзя одновременно обойти детекцию, сохранить качество и сделать это быстро. Треугольник невозможности. Выход: дифференцированная правка.

Мы перевели это в простое правило. На диагностике каждый абзац получает цвет. Красный (3+ маркеров): переписать целиком. Жёлтый (1-2): точечно поправить. Зелёный: руки прочь.

Третий пункт — самый неочевидный. Переписывание чистого абзаца через LLM вносит в него свежие AI-маркеры. Лечишь здорового и заражаешь.

Мелочи

Аудит стал трёхпроходным. Третий проход — «Кардиограмма» — проверяет информационный ритм для текстов длиннее 300 слов: скачет ли плотность или лежит ровно.

В сканер добавлены ритм-маркеры. Старые паттерны 17-18 (заглавная после двоеточия, Title Case) свёрнуты в строку: LLM в 2026-м эти ошибки уже не делают.

На чём основано

Пять статей 2025 года. DivEye (arxiv 2509.18880) про детекцию через surprisal-фичи второго порядка, те самые 39.4% вклада. CoPA (arxiv 2505.15337, EMNLP 2025) про contrastive paraphrase attack, давший +57.7%. TH-Bench (arxiv 2503.08708), бенчмарк на 6 атак × 13 детекторов × 19 доменов. Psycholinguistic Analysis (arxiv 2505.01800), где 31 стилометрическую фичу привязали к когнитивным процессам. И Adversarial Paraphrasing (arxiv 2506.07001, NeurIPS 2025), который уронил TPR детекторов на 87.88%.

Чего мы не знаем

Все пять статей на английском. Перенос на русский непрямой. Сами-то принципы (surprisal, предсказуемость токенов) от языка не зависят, но русскоязычных бенчмарков после RuATD-2022 так и нет. Знаете о свежих? Буду рад ссылке в комментариях.

И ещё фундаментальная ирония: скилл выполняет LLM, который сам склонен к тем же паттернам. «Пиши непредсказуемо» это как «не думай о белом медведе». Поэтому правила сделаны максимально механическими: конкретные замены, числовые пороги, светофор. Не философия, а чеклист.

Попробовать

/plugin install humanizer-ru

Бесплатно, MIT, открытый код: github.com/ilyautov/humanizer-ru

Канал с обновлениями: Gorilla Under Hood

3
1 комментарий