Рекомендательные алгоритмы

А давайте поговорим о современных рекомендательных алгоритмах. SEO было, разведочный поиск был. Рекомендательные алгоритмы уже сам Бог велел.
Важное замечание: у компаний, которые зарабатывают на рекомендательных алгоритмах, нет особенно мотивации все о них рассказывать. Кое о чем можно судить по косвенным признакам, кое-что есть в открытых данных, но это, разумеется, не все. Я пользуюсь только открытыми источниками, доступа к инсайдерской информации не имею, так что принимайте все, что здесь написано, с некоторой долей скептицизма.
Поехали.

<i>(Древний <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.pinterest.com%2Fpin%2Fi-maked-these-d--281686151668360820%2F&postId=1616464" rel="nofollow noreferrer noopener" target="_blank">мем</a>, переделанный мной. Олды тут?)</i>

Meta* старается придерживаться принципов прозрачности (или активно нас в этом уверяет), поэтому про свои алгоритмы пишет время от времени (главным образом они пишут о своей прозрачности, разумеется, но и об алгоритмах тоже). На сайте в отдельной секции «Прозрачность» у них есть карточки, которые объясняют работу рекомендательных алгоритмов, которые предлагают вам определенные новости.
В ленте новостей ИИ ранжирует посты людей и организаций, на которые вы подписаны. Этот ИИ собирает информацию о ваших подписках, авторах постов, ваших недавних взаимодействиях с этими авторами, числе ваших друзей, которым понравился пост, который вам будет предложен. На основании всей информации высчитывается релевантность для каждого поста, и по ней посты ранжируются. Кроме того, рекомендательная система ваш контент располагает так, чтобы вам не попадались, например, одни только видео или одни только тексты, а разные типы постов были бы перемешаны.

У вас есть возможность скрыть пост – это заставит систему понизить релевантность аналогичных постов в будущем; отписаться от друга, который читает и пишет всякую ерунду (или просто скрыть его посты и при встрече делать вид, что вам интересно). Если вы нажмете «показать больше», чтобы прочитать весь текст поста, это также будет сигналом для системы: его релевантность и релевантность похожих постов повысится (но временно). Вы также можете добавить некоторые страницы в избранное, и рекомендательная система будет показывать вам их чаще.
Есть и менее очевидные сигналы, за которыми пристально следят рекомендательные алгоритмы:

если пролистнете пост не задерживаясь, его релевантность (и релевантность похожих постов) снизится, задержитесь – повысится;
если досмотрите видео до конца, оно будет считаться более релевантным. Длительность видео и то, как скоро после публикации вы его открыли, тоже имеют значение;
читаете комментарии = проявляете интерес.

Рекомендательная система также ранжирует и комментарии. Эту функцию можно отключить, но только если у вас мало подписчиков. Если много, ранжирование не отключается (сколько это «много», я сходу не нашла).
Больше шансов попасть в топ (и вам на глаза) у комментариев, которые прочитало и лайкнуло больше людей, у комментариев, написанных популярными авторами с большим числом подписчиков (вот он закон Матфея в действии) и у более свежих комментариев.
С короткими видео (вы знали, что в Фейсбуке есть короткие видео? Я нет. У всех уже есть короткие видео) похожая ситуация:

если вы скрыли видео, система будет показывать вам меньше похожих;
если сохранили или отправили другу – будет показывать больше.

В материалах компании утверждается, что в поиске видео не ранжируются. То есть, если вы будете искать видео с рецептом омлета по запросу «рецепт омлета», вам выдадут видео, которые больше подходят по ключевым словам без учета ваших лайков на посты про аллергию на яйца.
Я думаю, в целом идея понятна. Вы встречаете пост о том, как носить воду в решете. Вы пишете комментарий: «Что за ерунда? Никто не носит воду в решете!». Вы отправляете пост другу с комментарием «Мир сошел с ума». И потом рекомендательная система старательно подбирает для вас посты и видео про ношение воды в решете, потому что вы проявили интерес. И вам кажется, что весь мир и правда сошел с ума и носит воду в решете. А на самом деле вы застряли в двух процентах интернета и не можете оттуда выбраться, потому что каждое видео вас возмущает до глубины души, и вы оставляете комментарии и шлете эти видео своим друзьям (затягивая их в пучину безумия следом за собой, между прочим).
Вот такие пироги.
Я не описала механизмы, которые влияют на рекомендацию вам новых друзей, присылание уведомлений и еще некоторые функции. Все это можно прочитать в карточках по ссылке, которую я оставляла выше, оставляю на ваше усмотрение.

Здесь тоже коротко пройдемся буквально по самой базе, тем более что основные принципы те же самые.
Для ленты новостей система отслеживает следующие сигналы:

как часто другие люди пролистывают пост, не вчитываясь;
пролистнули ли вы этот пост или задержались на нем;
как часто вы в целом делитесь постами вообще и постами этого автора в частности;
как часто другие люди поделились этим постом;
как часто вы нажимали «посмотреть все комментарии» под постом;
как часто вы комментировали похожие посты (на сайте написано «нажали на кнопку для комментария», так что, видимо, его не обязательно писать и оставлять: зачтется даже мысль о комментарии – это я додумываю. Более того, нигде не написано, что оценивается тональность комментария: негативный или позитивный – не важно, это сигнал системе рекомендовать больше подобного контента);
как часто вы пропускаете посты на определенной позиции в ленте (например, пролистываете первый пост);
сколько секунд вы проводите за чтением поста.

Со сторис все похоже, но еще, например, алгоритм оценивает вероятность того, что автор сторис – ваш хороший друг или член семьи. Любое взаимодействие повышает релевантность, отсутствие взаимодействия понижает. Если хотите чего-то не видеть, нажимайте «скрыть» или быстро пролистывайте пост к следующему, лента среагирует.
Если хотите привлечь больше аудитории, стимулируйте людей задерживаться на ваших постах (некоторые нехорошие люди пишут на сторис очень мелкий текст, чтобы заставить вас остановиться и прочитать), запрашивайте реакцию и инициируйте общение в комментариях. Ну это вы все знаете, каждый день с вас кто-то требует лайков и комментариев в Интренете. Я не буду требовать (но, если вдруг решите оставить, спасибо).

В официальном блоге платформы пишут, что рекомендательные алгоритмы на YouTube приносят больше просмотров, чем поиск или подписки. Наверное, это так, особенно если речь о коротких видео. Пост, который я цитирую, написан в 2021 году, и более свежего я быстро не нашла, поэтому возьмем что есть.
Итак, во-первых, алгоритм анализирует, что вы смотрите, ищет людей, которые смотрят то же самое и предлагает вам то, что смотрят они, а вы нет. Думаю, это не секрет ни для кого. Чтобы выйти из-под чуткого надзора, можно почистить историю просмотров или вообще ее не сохранять. Можно сохранять историю поиска, но не историю просмотров или наоборот (это в настройках, по умолчанию включены обе опции).

<i>(Заходим в историю просмотров -> управление данными и регулируем под себя)</i>

Система также чаще будет предлагать наиболее популярные видео, отслеживать глубину просмотра (досмотрели ли вы видео до конца), лайки и дизлайки, поделились ли вы видео и так далее. Полагаю, вы также знаете, что некоторые типы контента «пессимизируются» в поиске, то есть, рекомендуются пользователям меньше. Обычно речь идет о демонстрации сцен насилия, нецензурной брани и прочих подобных вещах.
Кстати, система оценки релевантности у YouTube динамическая. Например, если вы делитесь видео, оно будет считаться понравившимся вам, и система найдет для вас похожие видео. Однако, если вы часто делитесь видео, но при этом ставите им низкие оценки (иногда после просмотра вам предлагают оценить, насколько вам понравилось видео), то система будет меньше обращать внимание на то, что вы чем-то с кем-то поделились. Потому что для вас, похоже, это не признак одобрения.
В рамках ответственного подхода к формированию рекомендаций алгоритмы YouTube оценивают «полезность» или качество контента и меньше продвигают контент, признанный некачественным. В пример автор цитируемой мной публикаций приводит видео о плоской Земле – такие должны рекомендоваться вам меньше, даже если они вам нравятся. Является ли этот подход ответственным? Я сомневаюсь. Мне кажется, что площадка не должна ограничивать пользователей в выборе контента, если он не нарушает законодательство и не несет вреда окружающим. Я имею в виду контент с призывами к насилию, например, – это повод привлечь внимание правоохранительных органов. Однако в какой-то момент мы приходим к тому, что площадка решает, какой контент нам полезен, а какой нет, как будто мы неразумные дети. Для детей, пожалуй, такие ограничения имеют смысл, но для взрослых? Я не вижу в этом подходе ответственности, если честно. Более того, в самом же посте написано, что зрители сами не считают «пограничный» (или «некачественный», как было сказано ранее) контент привлекательным и сами смотрят его меньше.

Будет интересно почитать комментарии на сей счет.

Тут коротко, чтобы не затягивать. Основные принципы, я думаю, уже и так понятны.
В TikTok помимо прочего рекомендательная система обращает внимание на популярную сейчас аудиодорожку, проставленные автором хэштеги, наличие субтитров и дуэты с другими авторами. Серии коротких видео, объединенные общей темой, работают лучше, чем несвязанные короткие видео.
LinkedIn опирается в значительной степени на лайки, комментарии и то, какими постами вы делитесь с другими людьми. ИИ также оценивает контент на наличие нарушений правил площадки. Если ИИ с оценкой не справляется, к делу подключается редактор-человек. Значение также имеют хештеги, регулярность написания постов и взаимодействие с людьми из списка контактов. Это, главным образом, инструмент для потенциальных нанимателей и потенциальных сотрудников, которые ищут друг друга. Человек с заполненным профилем и регулярными постами будет иметь больше шансов попасться на глаза Той Самой компании.

Вы знаете людей, которые пишут под постами комментарии в духе «Что делает эта чушь в моей ленте?». Или вы знаете людей, которые не могут отлипнуть от соцсетей? Или вы знаете людей, которые ведут блоги и хотят привлечь больше внимания к своей работе? Покажите им этот пост.
В телеграме как таковой системы рекомендаций нет, насколько мне известно. Но если вы зайдете ко мне на канал, прочитаете там какой-нибудь пост и поставите ему реакцию, я порадуюсь и напишу еще постов на похожие темы. Может, мемов еще сделаю.

*Запрещена в РФ

**Принадлежит Meta, Meta запрещена в РФ

Рекомендательные алгоритмы

Facebook**

Instagram**

YouTube

Два слова об остальном

Заключение