{"id":14275,"url":"\/distributions\/14275\/click?bit=1&hash=bccbaeb320d3784aa2d1badbee38ca8d11406e8938daaca7e74be177682eb28b","title":"\u041d\u0430 \u0447\u0451\u043c \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043f\u0440\u043e\u0444\u0435\u0441\u0441\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u043f\u0440\u043e\u0434\u0430\u0432\u0446\u044b \u0430\u0432\u0442\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f72066c6-8459-501b-aea6-770cd3ac60a6"}

vc.ru superpowers: расширение для браузера, которое вы ждали

Краткая выжимка статей, определение синтетичности текста и даже уведомление о наличии в статье ссылки на Telegram-канал. Новые функции для VC и DTF, которые я добавил вместо Комитета.

В самом низу статьи ссылка, где можно будет скачать расширение для Safari и Chrome

В субботу я опубликовал своё мнение о том, что на VC должны появиться новые функции, поощряющие писать оригинальный контент.

На vc.ru должна появиться функция определения, что статью написал ChatGPT

Я люблю потреблять контент, но в последнее время меня стало раздражать обилие «щитпромптинга»: так называемые авторы и эксперты просто генерируют сырой контент в ChatGPT и выдают это за статью.

Основатель нескольких стартапов сел почитать авторские колонки

Обсуждение этичности определения синтетического текста переросло чуть ли не в обвинение редакции в бездействии и обсуждение влияния генеративных инструментов на журналистику. В основном, люди разделились на два лагеря: генеративные инструменты улучшают качество контента и генеративные инструменты ухудшают качество контента на сайте.

Пропустим серую мораль и перейдем к сути. Мой исследовательский энтузиазм побудил во мне желание самому добавить эту (и еще пару других функций) на сайт.

Так появилось расширение vc.ru superpowers.

В нем я реализовал три функции для сайтов Комитета (vc.ru и dtf.ru), две из которых хотел сам а третью предложили в комментариях.

  • Классификация статей – о чём и был мой пост
  • Краткая выжимка статей – она же summarize, как в Artifact
  • Проверка на наличие ссылки на Telegram – почему бы и нет?

Классификация

Я проверил работу алгоритма на статьях, которые считал синтетическими и которые на мой взгляд писал человек. Алгоритм ± подтвердил мое мнение

В январе OpenAI представили свой классификатор, обученный определять, является ли текст синтетическим – пятибалльная шкала, от very unlikely до likely AI-generated. Они не дали к нему прямой доступ и вообще сказали, что work in progress, а мне стало очень любопытно, поэтому в дело пошел reverse engineering.

Я достаточно быстро выяснил, что внутри классификатора используется некая модель model-detect-v2. Создав новый API Key, я попробовал использовать эту модель в Completions API, ожидая, что получу 403. Но, вместо ошибок API вернуло какие-то цифры. Я продолжил изучать код фронтенда OpenAI и нашел формулу, которая непонятные цифры из ответа превращала в процент синтетичности (термин придумал я).

Часть кода во фронтенде OpenAI, отвечающая за AI Text Classifier

В итоге, я воссоздал алгоритм классификатора и завернул его в расширение для Safari. Пока тестировал, заметил комментарий.

Сперва не обратил внимание, потом подумал – было бы забавно?

Я не гарантирую точность алгоритма: OpenAI заявляет что тексты, написанные ИИ, в 26% случаях определяются как «скорее всего, написаны ИИ», в то время как тексты, написанные человеком, в 81% случаев определяются как «скорее всего, написаны человеком».

Краткая выжимка

Она же – суммаризация. Процесс сжатия текста, сохраняя при этом его суть. Функция предельно простая, но дающая ощутимую пользу – как минимум понять, стоит ли читать статью.

Суммаризация не добавляет ничего от себя, просто сжимает текст в 70 слов

Пока писал этот текст, понял, что функция в ленте приведет к снижению просмотров, поэтому лучше разместить кнопку внутри статьи.

Реализовано просто – запрос в Osnova API достает текст материала и отправляет в Chat API. Первая часть запроса для роли system задает контекст: «Суммаризируй понятно и на русском языке, о чем статья, не длиннее 70 слов. Не добавляй ничего от себя», вторая содержит сам текст. Суммаризирует модель gpt-3.5-turbo-16k, поэтому можно не переживать за длину статей.

Все, описанное выше, скорее является Proof-of-concept того, что эти функции можно реализовать за пару дней, с чашкой чая в одной руке и ChatGPT в другой.

Уважаемая редакция или кто-нибудь из Комитета, если вы вдруг читаете, напишите мне и я отдам вам код! Можно как дополнительную фичу в подписке Плюс внедрить, суммаризацию уж точно – больше подписок продавать будете.

«Зачем я это прочитал, где ссылка на расширение и сколько стоит» – спросите вы?

Расширение vc.ru superpowers для браузеров Safari и Google Chrome будет бесплатным

Расширение сейчас на ревью в сторах. Через 2-3 дня ссылка для Safari и Chrome будет в канале Директор айти компании. Ну раз уж отдаю бесплатно, можно и подписаться, right?

Поделитесь мнением в комментариях, попробуете superpowers в деле? Предложите еще что-нибудь добавить?

Мнение?
Скачаю superpowers, то что нужно
Мне это не нужно
Промолчу
Показать результаты
Переголосовать
Проголосовать
0
41 комментарий
Написать комментарий...
Олег Павлов

Красава! Хотел запилить похожее расширение для оценки комментаторов:

– новорег
– первый коммент

Было бы оч полезно в инфоцыганских постах, мб ты быстрее запилишь, совсем времени нет, идея протухает(

Ответить
Развернуть ветку
Олег Лупиков
Автор

Прикольная идея, кстати. Просто плашку показать "это его первый комментарий" или "зарегистрировался сегодня" - даже ИИ не нужен

Ответить
Развернуть ветку
Владимир Присяжный

Тогда лучше дата регистрации + количество комментов

Ответить
Развернуть ветку
Олег Павлов

Ага, причем нужна именно эта комбинация параметров, т.к. каждый отдельно не так сильно выдает бота

Ответить
Развернуть ветку
Sergei Zotov

Идея на будущее: в краткой выжимке показывать только телеграм канал из концовки статьи

Ну а если серьезно, то клево! Удивлен отсутствию комментариев

Ответить
Развернуть ветку
Олег Лупиков
Автор

Оч жду реакцию Комитета )

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Невероятный Блондин
поэтому лучше разместить кнопку внутри статьи.

Фатальная ошибка.
Я бы взял расширение, но я совершенно точно не буду заходить в каждый пост и накручивать счетчик просмотра только чтобы понять что там синтетика.
Я и сейчас в такие не захожу, научился на глаз определять, хотя подтверждение глазомера пригодилось бы.
Но раз ты прячешь внутрь, то и смысла от него нет.

За сафари хвалю!

Ответить
Развернуть ветку
Alex

1) "Расширение содержит даже уведомление о наличии в статье ссылки на Telegram-канал"
2) В статье ссылка на тг канал, причем в самом темном паттерне — "чтобы следить за ссылкой" 🤷

Ответить
Развернуть ветку
Олег Лупиков
Автор

Иронично, да?

Ответить
Развернуть ветку
Alex

мне кажется с точки зрения установки расширений было лучше опубликовать статью когда расширение уже было бы доступно

Тк "прочитал — установил" простое действие

А сейчас кажется, что это принесено в жертву конверсии подписки на тг канал

Ответить
Развернуть ветку
Олег Лупиков
Автор

Yes, but

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Олег Лупиков
Автор

Раз

Ответить
Развернуть ветку
Невероятный Блондин

Нужно убрать «в статье есть»
Не каждый пост — статья или даже заметка.

Ответить
Развернуть ветку
Олег Лупиков
Автор

Два

Ответить
Развернуть ветку
Вадим Д.

Очень круто, 95 из 100 👍🏻! Ведь нужно же стремиться к идеалу? (-;

Очень хотелось бы планировщик публикаций. Понятно, что это не к Вам, но вдруг кто-то заметит 🙂

Ответить
Развернуть ветку
Олег Лупиков
Автор

На всякий случай записал))

Ответить
Развернуть ветку
Вадим Д.

Никогда не знаешь что может пригодиться 😉

И да, чуть не забыл: благодарю!

Ответить
Развернуть ветку
Дмитрий Беговатов

любопытно) если раскатывать на всю аудиторию VC, как на поведенческие факторы повлияет?

Ответить
Развернуть ветку
Олег Лупиков
Автор

Я предполагаю, что если суммаризацию прямо в ленте дать, может снизить engagement rate плохого контента. Повлияет ли на открываемость хороших статей — ХЗ

Ответить
Развернуть ветку
Дмитрий Беговатов

А еще ведь "время на сайте" есть.

Ответить
Развернуть ветку
Олег Лупиков
Автор

Да.. но палка о двух концах — удерживать читателя на сайте усложнением чтения или снижать sticky factor давая возможность быстро прочитать контент. Я ссылаюсь на Artifact: там, как у агрегатора, summarize внутри самих материалов доступен

Ответить
Развернуть ветку
Олег Лупиков
Автор

С другой стороны – если читатель сможет за то же количество времени «потребить» больше контента благодаря чтению кратких выжимок – это хорошо

Ответить
Развернуть ветку
Евгений Кондратьев
Ответить
Развернуть ветку
Sergei Zotov

кмк, вообще не повлияет. Народ и так статьи по диагонали читает, в основном сразу скроллит в комменты)

т.е. в комментах, кмк, больше value для висишного пользователя. А так - эти же новости/статейки он бы и в каком-нибудь телеграм канале мог почитать

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
Evil Pechenka
Проверка на наличие ссылки на Telegram

Считаю, что статьи без ссылки на Телеграм — надо распубликовывать.

Ответить
Развернуть ветку
Сергей Мазитов

Да вообще автору надо как-то хакнуть виси (может быть, чатгпт ему поможет?) и добавить в свое расширение кнопку "Распубликовать эту статью и забанить автора", которой смог бы пользоваться любой желающий, читая любую статью. Вот бы все повеселились))

Ответить
Развернуть ветку
Captain

А почему именно 70 слов? Может как-то пропорционально кол-ву текста этот параметр менять? По предложению на абзац или типа того.

Ответить
Развернуть ветку
Сергей Мазитов

Ну и эта штука видимо не сможет отличать личку ТГ от канала? А что плохого в том, чтобы указать личку для связи?

Ответить
Развернуть ветку
Роман Анисимов

Можно же отличить, просто открыть по ссылке и посмотреть, что в сниппете написано

Ответить
Развернуть ветку
Сергей Мазитов

"Можно отличить, если открыть и посмотреть" - это одно, а вот делает ли это расширение эту работу - открывает ли и "смотрит" — я уверен, что нет. На скриншотах просто написано, "есть ссылка на телеграм" - т.е оно анализирует только сам текст статьи, видит там http://t.me/что-тотам и всё, больше ничего не делает, сразу маркирует как телеграм.

Ответить
Развернуть ветку
Роман Анисимов

Ну да, я и имел в виду, что это, в общем-то, делается в два счёта, и странно, что не сделано

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Сергей Мазитов

Круто! Мне не терпится проверить мои статьи, которые я уж точно знаю, кто писал)) и прочитать к ним саммари.

Ответить
Развернуть ветку
Froxy

Сделайте для мозилы и верните дизлайки хотяб расширением(

Ответить
Развернуть ветку
Константин Сорокин

Make vc.ru tort again!

Ответить
Развернуть ветку
Павел Шкутко

Платным можно сделать накрутку процента в сторону человечности :)

Ответить
Развернуть ветку
Чайка О.
Мнение?

"Почему бы не попробовать?"

Ответить
Развернуть ветку
Mitridat Polyakov

Как человеку с дислексией.... Это ускорит мою работу значительно!!!

Ответить
Развернуть ветку
Евгений Кондратьев

Друг, поторопись с продажей расширения) А то сегодня вот чё нашёл

Ответить
Развернуть ветку
38 комментариев
Раскрывать всегда