vc.ru superpowers: расширение для браузера, которое вы ждали
Обсуждение этичности определения синтетического текста переросло чуть ли не в обвинение редакции в бездействии и обсуждение влияния генеративных инструментов на журналистику. В основном, люди разделились на два лагеря: генеративные инструменты улучшают качество контента и генеративные инструменты ухудшают качество контента на сайте.
Пропустим серую мораль и перейдем к сути. Мой исследовательский энтузиазм побудил во мне желание самому добавить эту (и еще пару других функций) на сайт.
Так появилось расширение vc.ru superpowers.
В нем я реализовал три функции для сайтов Комитета (vc.ru и dtf.ru), две из которых хотел сам а третью предложили в комментариях.
- Классификация статей – о чём и был мой пост
- Краткая выжимка статей – она же summarize, как в Artifact
- Проверка на наличие ссылки на Telegram – почему бы и нет?
Классификация
В январе OpenAI представили свой классификатор, обученный определять, является ли текст синтетическим – пятибалльная шкала, от very unlikely до likely AI-generated. Они не дали к нему прямой доступ и вообще сказали, что work in progress, а мне стало очень любопытно, поэтому в дело пошел reverse engineering.
Я достаточно быстро выяснил, что внутри классификатора используется некая модель model-detect-v2. Создав новый API Key, я попробовал использовать эту модель в Completions API, ожидая, что получу 403. Но, вместо ошибок API вернуло какие-то цифры. Я продолжил изучать код фронтенда OpenAI и нашел формулу, которая непонятные цифры из ответа превращала в процент синтетичности (термин придумал я).
В итоге, я воссоздал алгоритм классификатора и завернул его в расширение для Safari. Пока тестировал, заметил комментарий.
Я не гарантирую точность алгоритма: OpenAI заявляет что тексты, написанные ИИ, в 26% случаях определяются как «скорее всего, написаны ИИ», в то время как тексты, написанные человеком, в 81% случаев определяются как «скорее всего, написаны человеком».
Краткая выжимка
Она же – суммаризация. Процесс сжатия текста, сохраняя при этом его суть. Функция предельно простая, но дающая ощутимую пользу – как минимум понять, стоит ли читать статью.
Пока писал этот текст, понял, что функция в ленте приведет к снижению просмотров, поэтому лучше разместить кнопку внутри статьи.
Реализовано просто – запрос в Osnova API достает текст материала и отправляет в Chat API. Первая часть запроса для роли system задает контекст: «Суммаризируй понятно и на русском языке, о чем статья, не длиннее 70 слов. Не добавляй ничего от себя», вторая содержит сам текст. Суммаризирует модель gpt-3.5-turbo-16k, поэтому можно не переживать за длину статей.
Все, описанное выше, скорее является Proof-of-concept того, что эти функции можно реализовать за пару дней, с чашкой чая в одной руке и ChatGPT в другой.
Уважаемая редакция или кто-нибудь из Комитета, если вы вдруг читаете, напишите мне и я отдам вам код! Можно как дополнительную фичу в подписке Плюс внедрить, суммаризацию уж точно – больше подписок продавать будете.
«Зачем я это прочитал, где ссылка на расширение и сколько стоит» – спросите вы?
Расширение vc.ru superpowers для браузеров Safari и Google Chrome будет бесплатным
Расширение сейчас на ревью в сторах. Через 2-3 дня ссылка для Safari и Chrome будет в канале Директор айти компании. Ну раз уж отдаю бесплатно, можно и подписаться, right?
Поделитесь мнением в комментариях, попробуете superpowers в деле? Предложите еще что-нибудь добавить?
Красава! Хотел запилить похожее расширение для оценки комментаторов:
– новорег
– первый коммент
Было бы оч полезно в инфоцыганских постах, мб ты быстрее запилишь, совсем времени нет, идея протухает(
Прикольная идея, кстати. Просто плашку показать "это его первый комментарий" или "зарегистрировался сегодня" - даже ИИ не нужен
Идея на будущее: в краткой выжимке показывать только телеграм канал из концовки статьи
Ну а если серьезно, то клево! Удивлен отсутствию комментариев
Оч жду реакцию Комитета )
поэтому лучше разместить кнопку внутри статьи.Фатальная ошибка.
Я бы взял расширение, но я совершенно точно не буду заходить в каждый пост и накручивать счетчик просмотра только чтобы понять что там синтетика.
Я и сейчас в такие не захожу, научился на глаз определять, хотя подтверждение глазомера пригодилось бы.
Но раз ты прячешь внутрь, то и смысла от него нет.
За сафари хвалю!
1) "Расширение содержит даже уведомление о наличии в статье ссылки на Telegram-канал"
2) В статье ссылка на тг канал, причем в самом темном паттерне — "чтобы следить за ссылкой" 🤷