{"id":10861,"title":"\u0417\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u0435 \u043f\u0438\u043b\u043e\u0442 \u0432 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u0435 PwC Venture Hub","url":"\/redirect?component=advertising&id=10861&url=https:\/\/vc.ru\/promo\/349044-korotko-zapustit-pilot-i-poluchit-novyh-klientov-s-pwc&placeBit=1&hash=4330fcc6373e035951e6ff64a3ae572ba5f30463fe8776204270bbc0bd091c81","isPaidAndBannersEnabled":false}
ЯRUS

Как ЯRUS ежедневно собирает более 56 000 новостей из источников и выбирает из этого самое интересное

Сегодня уже мало кто заходит на один единственный сайт, чтобы почитать новости. Медиаполе современного человека соткано из множества инфопотоков и ресурсов, и для многих вопрос информационной гигиены стоит очень остро. Где и как организовать удобную новостную ленту, которая бы имела максимально широкий охват источников, но при этом выдавала бы из них только интересные конкретному пользователю материалы? Именно эту проблему решает раздел новостей в приложении ЯRUS, о котором пойдет речь ниже.

Ежедневно агрегатор мониторит около 10 тысяч новостных ресурсов и собирает не менее 56 000 новостей для парсинга. Со стороннего ресурса берутся заголовок, текст и изображения, поэтому у пользователя приложения есть возможность прочесть новость, не покидая его. При этом в ленте отображаются не только заголовки, но и лид, что дает возможность быстро оценить, стоит ли открыть новость и продолжить чтение или же листать дальше.

Но собрать новости с ресурсов – это лишь полдела. Важно показать пользователю только действительно важные и обсуждаемые публикации, чтобы сформировать верное представление об актуальной повестке дня. Другими словами, сделать так, чтобы новость о результатах выборов шла первой в выдаче, а о ремонте дороги в Подмосковье – на несколько скроллов ниже. Вторая задача – дать пользователю возможность самому настроить ленту под свои интересы.

Каждую из этих задач решает отдельная лента. Первая называется «Тренды» – в ней юзер видит актуальный срез новостей, которые волнуют общественность на данный момент больше всего. Чтобы новость попала в топ, она должна соответствовать ряду критериев. Во-первых, учитывается посещаемость оригинального источника – чем качественнее новостной ресурс, тем больше у него вес и тем больше вероятность, что его материалы попадут в тренды. Во-вторых, важна дата публикации – у старого материала мало шансов появиться в топе. Также большую роль играет цитируемость, т. е. частота появления того или иного сюжета в медиаполе. Тот факт, что про блокировку Telegram написало много изданий говорит о высокой цитируемости сюжета, поэтому у публикации с такой темой высокие шансы попасть в топ трендов.

Вторую задачу решает лента «Интересы» – ее пользователь может настроить так, как ему удобно, а наполнение происходит уже не на основе популярности новостного сюжета, а на том, как сильно публикация соответствует заданным интересам юзера.

К примеру, человек увлечен автомобилями и наукой и совершенно не хочет читать про политику. Тогда он выбирает соответствующие категории из списка и получает новости лишь по этим двум темам. Интересы можно выбрать не только из списка, но и указать свои.

Поиск публикаций по стандартным категориям осуществляется при помощи искусственного интеллекта, который был обучен определять тему новости на тысячах тренировочных текстов. Благодаря этому пользователь, выбравший в интересах науку, увидит в своей ленте новость, посвященную Большому адронному коллайдеру, даже если в ее тексте нет слова «наука».

При указании же интересов не из списка подбор идет именно по конкретному слову, т. е. в выдаче появляются все новости, в тексте которых это слово встречается. Да, такая модель выглядит более примитивной, но зато для более детальной настройки ленты с собственными интересами существует специальный инструмент: плюс-/минус-слова.

К примеру, пользователь хочет читать новости про дизайн, но не про дизайн интерьеров. Тогда он добавляет минус-слово «интерьер» в соответствующее поле, и в его ленте больше не появится новостей на эту тему. Плюс-слова работают по обратному принципу: они добавляют в ленту больше новостей с указанным словом.

Следующий этап развития раздела – тегировать каждую новость по темам, чтобы собрать объемную базу дополнительной внутренней уточняющей информации, на основе которой алгоритм будет еще точнее сортировать новости по категориям. А планируется это сделать в одном из ближайших релизов.

0
0 комментариев
Популярные
По порядку
Читать все 0 комментариев
Mastercard снизит межбанковские комиссии при оплате картой на Wildberries, Aliexpress, Ozon и других маркетплейсах Статьи редакции

Условия начнут действовать с 31 января 2022 года.

Прими участие 1 февраля в бесплатном вебинаре «10 принципов успешной презентации»

1 февраля в 17:00 Бизнес-инкубаторе ВШЭ проведет бесплатный онлайн-вебинар «10 принципов успешной презентации».

Что такое дизайн в корпоративно-инвестиционном банкинге – на примере приложения Райффайзен Бизнес Плюс

Всем привет, меня зовут Никита Маврин и я продуктовый дизайнер в команде корпоративных цифровых каналов в Райффайзен Банке. Расскажу о том, как мы разрабатывали дизайн первого мобильного банка для руководителей большого бизнеса. А ещё о том, почему дизайнеру классно развиваться в корп-инвест банкинге.

Ёлки, столы и другие опыты: как ищет точки роста цех, который строил стенды для выставок, а потом — столы для удалёнки Статьи редакции

Монолог предпринимателя о выходах из ситуации, когда спрос на твои основные продукты резко падает уже во второй раз за два года, а материалы не дешевеют.

Производство Stayhomedesk
С инфоцыганами все ок, и их клиенты не идиоты. И вот почему

Есть расхожее мнение, что инфоцыгане — это мошенники, которые дурят невинных граждан, научить ничему не могут, обещаний своих не выполняют, и гореть бы им в своем высокоэффективном аду. Ах, если бы все было так просто.

Python-разработчик, UX-писатель и Product-менеджер. На кого учатся россияне и сколько тратят на онлайн-образование

Ко Дню студента мы выяснили, как в 2021 году изменился спрос на онлайн-образование по сравнению с 2020 годом. Рассказываем, что изменилось за год, и какие направления онлайн-образования пользуются наибольшей популярностью.

Исследователи нашли вирус в доработанных модулях «1С» — он украл данные «десятка компаний» Статьи редакции

Программа отправляла информацию о клиентах, платежах и потенциальных договорах на чужую почту.

Как мы увеличили выручку в пять раз при помощи ИТ-решений

«Ойл Ресурс Групп» была маленькой компанией с ручным трудом и низкой эффективностью.

Мобильное приложение «Топливо» и маркетплейс ОРГ-Маркет

Как попасть в ЧС телефонных спамеров?

Реальная рабочая схема попадания в черный список телефонных спамеров. Сработала против спама от Совкомбанка, Альфа-банка, Дом.ру, Билайна, ремонта оконных рам, расчетных счетов для бизнеса и не только.

Приглашаем автоматизаторов тестирования в команду SberDevices

Салют, на связи команда SberDevices! Объявляем первый в году One Day Offer. На этот раз мы приглашаем автоматизаторов тестирования уровня Middle/Senior, которые специализируются на UI-тестах для девайсов на Android. Также ищем QA-инженеров по тестированию backend’а виртуальных ассистентов Салют. Работа ответственная и масштабная — вас ждут…

null