Как работает рекомендательная система «Яндекс.Музыки» Статьи редакции

«Яндекс» в своём блоге опубликовал материал о принципах работы системы рекомендаций в сервисе «Яндекс.Музыка», которая работает с сентября 2014 года. Алгоритм даёт пользователю персональные рекомендации и со временем обучается, основываясь на его вкусах.

Как выявляются предпочтения

Прежде чем советовать пользователю ту или иную музыку, необходимо составить представление о его музыкальных вкусах. Самый простой способ сделать это — посмотреть, какие треки на «Яндекс.Музыке» он уже послушал. Это самая важная информация для рекомендательной системы; по истории прослушиваний можно установить, каких исполнителей и какие жанры человек предпочитает. Однако чтобы составить более полную картину, неплохо ещё понимать, что ему нравится больше, а что — меньше.

Для этого мы используем дополнительные данные. Один из источников таких данных — оценки «Нравится» и «Не нравится», которые ставят пользователи. Оценку «Нравится» в «Яндекс.Музыке» можно ставить трекам, альбомам, исполнителям и целым музыкальным жанрам. Оценка «Не нравится» есть в жанровом радио и в радио по исполнителю: с её помощью можно отметить треки, которые пришлись не по душе.

Как правило, люди оценивают музыку, которая вызвала у них сильный эмоциональный отклик — неважно, положительный или отрицательный. Поэтому оценки довольно точно отражают пристрастия человека. Но одних оценок недостаточно: во-первых, люди ставят их далеко не всегда, а во-вторых, в шкале не хватает полутонов — есть только или «хорошо» («Нравится»), или «плохо» («Не нравится»).

Поэтому, помимо оценок и прослушиваний, мы обращаем внимание и на другие действия пользователя: пропуски треков (например, в альбоме, подборке или радио) и добавления треков в плейлисты.

Все действия мы разделяем на положительные и отрицательные. Положительные — прослушивание, оценка «Нравится», добавление в плейлист — говорят о том, что музыка нравится пользователю, а отрицательные — пропуск и оценка «Не нравится» — наоборот. Важно понимать, что действия неравнозначны: например, пользователь может пропустить трек, который в целом ему по душе, но сейчас не подходит под настроение. Поэтому каждому действию мы присваиваем вес: у оценки «Нравится» он максимальный, а у пропуска — минимальный.

Как строится прогноз

Алгоритм анализирует профиль пользователя (то есть данные о его музыкальных предпочтениях) и предсказывает, какие треки и исполнители могут ему понравиться. Кроме того, алгоритм умеет дообучаться в режиме реального времени. Каждый раз, когда вы совершаете новое действие — слушаете трек или добавляете его в плейлист, — профиль обновляется, и прогноз строится заново. Это позволяет быстро подстраиваться под вкусы и предлагать музыку, которая отвечает сегодняшнему настроению.

Делая прогноз, алгоритм также учитывает информацию о том, как связаны друг с другом объекты из каталога «Яндекс.Музыки»: треки, альбомы, исполнители, жанры. Благодаря этим данным можно советовать человеку новых исполнителей в его любимом жанре. Кроме того, система сравнивает профили всех пользователей «Яндекс.Музыки». Это делается для того, чтобы выявить людей со схожими музыкальными предпочтениями: то, что нравится одному, может понравиться и другому.

Как составляются рекомендации

Обработав данные, алгоритм выдаёт список треков и исполнителей, которые могут понравиться пользователю. Считать его окончательной рекомендацией, однако, нельзя. Во-первых, список слишком длинный — чтобы прослушать все треки, которые система выбрала за раз, не хватит и суток. Во-вторых, мы считаем, что рекомендации должны быть разнообразными: они должны включать в себя не только советы вида «раз вам понравилось X, послушайте Y», но и что-то ещё, что помогло бы сориентироваться в мире музыки — скажем, сообщения о новых релизах любимых исполнителей или чарты треков в жанрах, которые вам нравятся.

Поэтому прогноз, построенный алгоритмом на основе профиля пользователя, мы «разбавляем» информацией из других источников. Это могут быть сведения о том, что слушают друзья из социальных сетей, актуальные подборки — саундтрек к только что вышедшему фильму или сборник композиций, прозвучавших на недавнем музыкальном фестивале, — или списки треков, которые рекомендуют любимые исполнители.

Окончательный список рекомендаций составляется с помощью «Матрикснета» — разработанного в «Яндексе» метода машинного обучения. «Матрикснет» обрабатывает список всех возможных рекомендаций — как полученных прогнозированием, так и составленных по другим источникам — и определяет, какие именно следует показать пользователю на главной странице «Яндекс.Музыки» и в каком порядке их расположить. Формула, по которой составляется лента рекомендаций, учитывает множество факторов — от сведений о том, сколько раз человек прослушал тот или иной трек, до времени суток: бывает так, что утром нравится одна музыка, а вечером — другая.

Задача рекомендаций в «Яндекс.Музыке» — помогать людям открывать для себя новую музыку. Новую не значит современную — система может посоветовать вам и треки, выпущенные в этом году, и музыку, написанную в XVIII веке. Главное — это будет музыка, которую вы ещё не слышали, но которая вам, скорее всего, понравится.

{ "author_name": "Константин Панфилов", "author_type": "self", "tags": ["\u044f\u043d\u0434\u0435\u043a\u0441_\u043c\u0443\u0437\u044b\u043a\u0430","\u044f\u043d\u0434\u0435\u043a\u0441","\u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0430\u0446\u0438\u0438","\u043a\u0430\u043a_\u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442_\u044f\u043d\u0434\u0435\u043a\u0441_\u043c\u0443\u0437\u044b\u043a\u0430"], "comments": 12, "likes": 14, "favorites": 1, "is_advertisement": false, "subsite_label": "flood", "id": 7303, "is_wide": true, "is_ugc": true, "date": "Fri, 20 Mar 2015 14:34:11 +0300", "is_special": false }
0
12 комментариев
Популярные
По порядку
Написать комментарий...

Как работает рекомендательная система «Яндекс.Музыки» — да никак, она не работает

6

Комментарий удален

а spotify, deezer ?

2

Комментарий удален

Хорошо описано, я как ежедневный пользователь Яндекс.Музыки вижу одно и тоже. Наверное я как-то не так слушаю)

2

++ тоже както пользовался и в итоге пришел к выводу, что там просто рекламируют определенные группы и ничего подобного из сего нету. Хорошо если бы сделали

2

Комментарий удален

Комментарий удален

Комментарий удален

Комментарий удален

Комментарий удален

Комментарий удален

Комментарий удален

Это не рассказ о том, как работает рекомендательная система. Узнать о том, как работает практически любая рекомендательная система, и Яндекс.Музыки в том числе, можно, например, прослушав этот курс - https://www.coursera.org/learn/recommender-systems

2

Комментарий удален

Единственные у кого работает, это Pandora. У Spotify работает хуже, намного, но работает. У остальных не работает вовсе.

1

Комментарий удален по просьбе пользователя

1

У Яндекса та же проблема, что и у GoogleMusic и подобных - почти отсутствует база андеграунд-исполнителей и постоянная возня по одним и тем же трекам.

1

Слушать периодически музыку на Яндексе, но ищу рекомендации на Last FM.

1

Похоже, яндекс не учитывает музыку, которую я слушаю (а главное - слушал раньше) до перехода в я.музыку, а мог бы - данные моего ласт.фм у него есть. В остальном же рекомендациями я доволен настолько, что несколько раз в неделю слушаю в дороге именно рекомендации и уже открыл для себя несколько интересных исполнителей, до которых без этого еще хз когда дошел бы. Так что отзывы предыдущих ораторов "ни хрена не работает" вызывают у меня искреннее недоумение.

1

ну чо там норм нет? можно уже переходить со spotify в я.музыку?

0

Яндекс просканировал мою музыку из VK, и теперь каждый день суёт её как новую.

Иногда встречаются офигенные инди-группы, о которых я даже и не знал.

А вообще, странно он рекомендует. Иногда целый день дабстеп, иногда весь день какая-то попса, иногда шансон. wtf? Хорошо хоть русский рэпчик не суёт.

0

Комментарий удален

Комментарий удален

Комментарий удален

Читать все 12 комментариев
Исследование: сотрудники хотели бы иметь комнату отдыха, бесплатный сок, а работодатели уже готовы покупать ЗОЖ-снеки

Онлайн-сервис доставки продуктов и товаров СберМаркет и исследовательское агентство Research Me спросили сотрудников, как они хотели бы питаться в офисе и что в нем видеть. В опросе приняли участие более 1500 работающих людей по всей России. Сервис также спросил работодателей – В2В-клиентов СберМаркета: что они покупают в офис, что точно никогда…

Как OTUS стал платформой для самореализации. История преподавателя

Наш преподаватель, специалист по Data Science, решил поделиться своей историей преподавания. Он рассказал, как пришел в эту сферу, с какими трудностями столкнулся на пути к преподаванию и что ему помогает. А еще поделился советами, как поддерживать внимание студентов и сделать занятия полезными и увлекательными.

Наладили производство подделок и обманули Лувр: как братья из Одессы заработали на фальшивых древностях Статьи редакции

Шепсель и Лейба Гохманы в конце 19-го века продали Франции подделку под видом древней золотой тиары за 200 тысяч франков и ушли безнаказанными, а создатель украшения прославился в Европе — его тиара до сих пор хранится в Лувре.

Открытка с изображением поддельной тиары скифского царя Сайтаферна Amusing Planet
М.Видео обманул меня с предзаказом Apple Watch Series 7

Печали пост. Как только 8 октября открылся предзаказ на Apple Watch Series 7, поспешил на сайты apple.com, М.Видео и еще несколько маркетплейсов.

Cloud CDN: что это такое, как устроено и кому нужно. Разбираем на примере бургеров

Cloud CDN — это сеть быстрой доставки статического контента в формате услуги облачного провайдера. Объяснить, как работает технология, проще всего на примере — сравнить Cloud CDN с популярным продуктом, который выглядит плюс-минус одинаково вне зависимости от того, заказали вы его в Москве, Питере или Нью-Йорке. Знакомьтесь: классический бургер.…

Я устал жить на автомате и сделал бота в Telegram, который напоминает сколько мне осталось жить

Теперь бот присылает каждую неделю новую таблицу жизни, где видно сколько мне осталось до 90 лет. Красный квадрат – 1 прожитая неделя.

Пример календаря жизни. @life_table_bot
В Петербурге объявили частичный локдаун с 30 октября по 7 ноября Статьи редакции

Вводятся ограничения на работу предприятий общепита, розничной торговли, объектов развлечения и досуга.

Статья дополняется
Правительство утвердило правила идентификации пользователей мессенджеров с марта 2022 года Статьи редакции

Сервисы должны будут запрашивать данные у операторов, а те — предоставлять их в течение 20 минут после регистрации пользователя.

Как не попасть в карьерную ловушку тимлида: личный опыт

Кажется, что тимлиду просто некуда расти: дальше надо либо идти в менеджмент, либо наоборот, становиться узконаправленным разработчиком. По просьбе «Лаборатории Касперского» Евгений Мацюк, который прошел в компании неординарный путь, рассказал о своих карьерных развилках во время и после тимлидства, а также поделился опытом горизонтального роста.

Реклама в газетах и CRM: как мы массово нанимаем синих воротничков в швейное производство

У нас в Кофтёнышах, 80% сотрудников — это производственный персонал: швеи, упаковщицы, мастера, а 20% — коммерческий и административный: дизайнеры, маркетологи, менеджеры интернет-магазина.

Несколько лет у нас было чёткое деление, где искать людей на свои позиции: синие воротнички на SuperJob и Авито, белые воротнички — на HeadHunter. Со временем видение изменилось, а подход мы систематизировали.

null