vc.ru superpowers: расширение для браузера, которое вы ждали

Краткая выжимка статей, определение синтетичности текста и даже уведомление о наличии в статье ссылки на Telegram-канал. Новые функции для VC и DTF, которые я добавил вместо Комитета.

В самом низу статьи ссылка, где можно будет скачать расширение для Safari и Chrome
В самом низу статьи ссылка, где можно будет скачать расширение для Safari и Chrome

В субботу я опубликовал своё мнение о том, что на VC должны появиться новые функции, поощряющие писать оригинальный контент.

Обсуждение этичности определения синтетического текста переросло чуть ли не в обвинение редакции в бездействии и обсуждение влияния генеративных инструментов на журналистику. В основном, люди разделились на два лагеря: генеративные инструменты улучшают качество контента и генеративные инструменты ухудшают качество контента на сайте.

Пропустим серую мораль и перейдем к сути. Мой исследовательский энтузиазм побудил во мне желание самому добавить эту (и еще пару других функций) на сайт.

Так появилось расширение vc.ru superpowers.

В нем я реализовал три функции для сайтов Комитета (vc.ru и dtf.ru), две из которых хотел сам а третью предложили в комментариях.

  • Классификация статей – о чём и был мой пост
  • Краткая выжимка статей – она же summarize, как в Artifact
  • Проверка на наличие ссылки на Telegram – почему бы и нет?

Классификация

Я проверил работу алгоритма на статьях, которые считал синтетическими и которые на мой взгляд писал человек. Алгоритм ± подтвердил мое мнение
Я проверил работу алгоритма на статьях, которые считал синтетическими и которые на мой взгляд писал человек. Алгоритм ± подтвердил мое мнение

В январе OpenAI представили свой классификатор, обученный определять, является ли текст синтетическим – пятибалльная шкала, от very unlikely до likely AI-generated. Они не дали к нему прямой доступ и вообще сказали, что work in progress, а мне стало очень любопытно, поэтому в дело пошел reverse engineering.

Я достаточно быстро выяснил, что внутри классификатора используется некая модель model-detect-v2. Создав новый API Key, я попробовал использовать эту модель в Completions API, ожидая, что получу 403. Но, вместо ошибок API вернуло какие-то цифры. Я продолжил изучать код фронтенда OpenAI и нашел формулу, которая непонятные цифры из ответа превращала в процент синтетичности (термин придумал я).

Часть кода во фронтенде OpenAI, отвечающая за AI Text Classifier
Часть кода во фронтенде OpenAI, отвечающая за AI Text Classifier

В итоге, я воссоздал алгоритм классификатора и завернул его в расширение для Safari. Пока тестировал, заметил комментарий.

Сперва не обратил внимание, потом подумал – было бы забавно?
Сперва не обратил внимание, потом подумал – было бы забавно?

Я не гарантирую точность алгоритма: OpenAI заявляет что тексты, написанные ИИ, в 26% случаях определяются как «скорее всего, написаны ИИ», в то время как тексты, написанные человеком, в 81% случаев определяются как «скорее всего, написаны человеком».

Краткая выжимка

Она же – суммаризация. Процесс сжатия текста, сохраняя при этом его суть. Функция предельно простая, но дающая ощутимую пользу – как минимум понять, стоит ли читать статью.

Суммаризация не добавляет ничего от себя, просто сжимает текст в 70 слов

Пока писал этот текст, понял, что функция в ленте приведет к снижению просмотров, поэтому лучше разместить кнопку внутри статьи.

Реализовано просто – запрос в Osnova API достает текст материала и отправляет в Chat API. Первая часть запроса для роли system задает контекст: «Суммаризируй понятно и на русском языке, о чем статья, не длиннее 70 слов. Не добавляй ничего от себя», вторая содержит сам текст. Суммаризирует модель gpt-3.5-turbo-16k, поэтому можно не переживать за длину статей.

Все, описанное выше, скорее является Proof-of-concept того, что эти функции можно реализовать за пару дней, с чашкой чая в одной руке и ChatGPT в другой.

Уважаемая редакция или кто-нибудь из Комитета, если вы вдруг читаете, напишите мне и я отдам вам код! Можно как дополнительную фичу в подписке Плюс внедрить, суммаризацию уж точно – больше подписок продавать будете.

«Зачем я это прочитал, где ссылка на расширение и сколько стоит» – спросите вы?

Расширение vc.ru superpowers для браузеров Safari и Google Chrome будет бесплатным

Расширение сейчас на ревью в сторах. Через 2-3 дня ссылка для Safari и Chrome будет в канале Директор айти компании. Ну раз уж отдаю бесплатно, можно и подписаться, right?

Поделитесь мнением в комментариях, попробуете superpowers в деле? Предложите еще что-нибудь добавить?

Мнение?
Скачаю superpowers, то что нужно
Мне это не нужно
Промолчу
5151
42 комментария

Красава! Хотел запилить похожее расширение для оценки комментаторов:

– новорег
– первый коммент

Было бы оч полезно в инфоцыганских постах, мб ты быстрее запилишь, совсем времени нет, идея протухает(

11
Ответить

Прикольная идея, кстати. Просто плашку показать "это его первый комментарий" или "зарегистрировался сегодня" - даже ИИ не нужен

8
Ответить

Идея на будущее: в краткой выжимке показывать только телеграм канал из концовки статьи

Ну а если серьезно, то клево! Удивлен отсутствию комментариев

3
Ответить

Оч жду реакцию Комитета )

4
Ответить

поэтому лучше разместить кнопку внутри статьи.Фатальная ошибка.
Я бы взял расширение, но я совершенно точно не буду заходить в каждый пост и накручивать счетчик просмотра только чтобы понять что там синтетика.
Я и сейчас в такие не захожу, научился на глаз определять, хотя подтверждение глазомера пригодилось бы.
Но раз ты прячешь внутрь, то и смысла от него нет.

За сафари хвалю!

3
Ответить

1) "Расширение содержит даже уведомление о наличии в статье ссылки на Telegram-канал"
2) В статье ссылка на тг канал, причем в самом темном паттерне — "чтобы следить за ссылкой" 🤷

2
Ответить