Персонализированная лента новостей с помощью ИИ: как оставаться в курсе новостей в своей нише

Я профессионально занимаюсь исследованиями. Аналитика важных событий и трендов под задачи бизнеса - знакомые для меня задачи. Недавно я разработала бота на базе ИИ, который готовил для меня сводку технологических новостей. На прошлой неделе я его видоизменила и сделала доступным. Делюсь ботом, другими протестированными решениями для анализа новостей и уроками, которые я почерпнула в процессе разработки бота.

Предисловие.

В разные периоды моей профессиональной деятельности я сталкивалась с дилеммой: хочу быть в курсе новостей индустрии, не хочу затрачивать на это много сил и времени. Ручная работа с новостями - это слив большого объема энергии на поиск релевантного, а значит и на отсмотр не релевантных, а часто и разрушающих психику, новостей.

Помимо слива энергии есть проблема с пониманием актуальности новостной повестки. Ок, гугл выпустил новую модель - что это значит для рынка и для меня? Аналитика новостей - вторая большая задачка после отбора релевантного. В этом смысле, кругозор большой языковой модели шире кругозора человека: она порой лучше делает выводы о релевантности новости, подсвечивая то, что прошло мимо меня.

Существующие решения: от агрегаторов новостей до авторских подборок

Выделю три типа решений: (1) решения для сборки новостной ленты (агрегаторы новостей), (2) решения для создания выжимки новостной ленты с помощью ИИ, (3) авторские подборки новостей

1. Агрегаторы новостей

На рынке есть несколько инструментов, которые позволяют трекать новости из множества источников. Они работают по следующему принципу: вы выбираете какие новостные источники хотите трекать, они собирают для вас единую сводку новостей. Я их протестировала, и вот парочка лучших (они же самые популярные):

  • Feedly - помимо новостных источников позволяет трекать newsletters (почтовые рассылки)
  • Inoreader - помимо новостных источников позволяет трекать телеграм-каналы.

Проблема этих сервисов в том, что на выходе вы получаете длинную сводку новостей. Читать это всё - крайне энергозатратно, и если вы не занимаетесь профессионально трендвотчингом, то вероятно оно того не стоит.

2. Краткая выжимка с ИИ

Есть приложения с попыткой решения проблемы объема с помощью ИИ, например, приложение для macbook - Bulletin. Но по моему опыту - сводка получается некорректная.

К сожалению, ни один из изученных мной инструментов не способен предоставить качественную, обработанную ИИ, аналитическую сводку новостей, за адекватные деньги.

3. Авторские подборки.

Есть авторы, очень талантливо вручную собирающие и комментирующие новости. Раньше именно их я и читала. Но проблема в том, что у каждого свой угол обзора. Готовить сводки новостей - это как записывать конспекты лекций. Два разных человека слушают одно и то же, а выводы делают совершенно разные.

Своя разработка: персональная лента новостей технологий в телеграме

Так как боль не решена, хотелось поэкспериментировать и создать свое идеальное решение. Как результат создала канал в телеграм, сначала на английском, затем и на русском.

В эти каналы каждый день примерно в 10 утра бот присылает сводку новостей, обработанную ИИ. В чем он персонализирован? В тематике и источниках:

  • Новостные источники: TechCrunch, Futurism, Wired, The Verge, CNews, Engadget
  • Акцент на технологиях: ИИ, блокчейн, квантовый компьютинг, робототехника и нейрокомпьютерный интерфейс (BCI)
  • Дополнительный акцент: влияние на социум, интеграция в системы правопорядка и социальные службы (если есть новости по этим темам, он их интегрирует в ленту)
  • Объем: от 5 до 15 новостей в день. 4-6 предложений на новость в англоязычном канале, 1-2 - в русскоязычном.

Уроки, выведенные из разработки бота

Первую версию я выкатила два месяца назад. С тех пор я докручивала бота и наблюдала за изменением результатов. Делюсь наблюдениями, которые показались любопытными:

1. Промпт инженер из ИИ не так крут

Казалось логичным, что языковая модель сама напишет себе хороший промпт по моим требованиям. Но лучше всего работали мои промпты на корявом человеческом языке. ИИ однозначно лучше знает английский и красивее на нём формулирует. Но весомая часть сутевых доработок от ИИ скорее портила выдачу.

2. Как не настраивай ИИ, важные новости все равно выпадают

Я продолжаю сталкиваться с интересными новостями, которые упустил бот, в других источниках. С одной стороны, почти все отобранные новости отвечают правилам и релевантны. Но что-то важное всё же упускает из виду.

3. На русском языке читать “воду” болезненнее чем на английском

Вот такой культурный инсайт. Бот выдавал каждую новость по структуре: сначала суть события, затем рассуждения о влиянии. В подготовке к следующему этапу разработки я сделала перевод всего на русский язык. И на русском дальше сути читать получается только с закатыванием глаз.

4. Не понятно, как отделять новость от рекламы

В правилах отбора новостей прописано, что нужно следить за ключевыми игроками рынка. Обычно это очень полезно. Но иногда новости - неприкрытый пиар или реклама нового продукта. Единственный известный мне внутренний инструмент работы с этим - смотреть на все позитивные новости с подозрением. Как бы этот нативный скилл постсоветской ментальности трансфернуть ИИ?

5. Ужас, американцы реально постоянно судятся

Трекинг крупных игроков рынка означает, постоянно следить за тем, как они пытаются друг друга потопить судебными исками. И как к этому действу время от времени подключается государство со своим регулированием технологий, антимонопольным законодательством и прочим. Это и любопытно и надоедает, иногда кажется, что всё это игра и не стоит внимания.

План на будущее: аналитика.

Как писала в начале, одна из болей, которая пока не решена, это получать не только сводку новостей, но и анализ: что важно, почему это важно, какой тренд за этим скрывается, какое влияние это будет иметь на социум. Сейчас в большинстве случаев выводы получаются слишком банальными, поэтому я их убрала. Есть несколько путей улучшения, буду тестировать гипотезы и смотреть, что лучше работает.

Вообще, весь этот эксперимент, надеюсь, поможет мне вывести какие-то универсальные технологические инструменты для анализа новостей.

А вы сталкивались с проблемой трекинга новостей / трендвотчинга / анализа новостей? Поделитесь, как решали?

Ссылки:

11
2 комментария

Заметка о "воде" на русском языке действительно факт. Часто именно тексты на родном языке могут ощущаться перегруженными лишними рассуждениями. Надеюсь, этот момент решается в боте.

1

У меня гипотеза, что когда читаешь на английском, все равно напрягаешься немного: язык не родной, узнаешь новые речевые обороты, лексику, оттачиваешь навык чтения на иностранном. И не кажется что это вода, потому что мозг напрягается в любом случае. Я пока решила этот момент тем, что сократила объем текста на русском. Так, вода просачивается в меньшем объеме :)