Spotify

«Spotify: История продукта». Как мы разработали алгоритмы музыкальных рекомендаций

Из онлайн-библиотеки — в сервис персонализированных рекомендаций.

Это третья статья из серии «Spotify: история продукта», мы уже рассказали о создании десктопной версии сервиса и разработке мобильного приложения.

Spotify Studio

Первые попытки и старт работы над алгоритмом

За последние годы мы разработали несколько алгоритмов рекомендаций аудиоконтента, которые можно считать одними из самых мощных в мире. Все они работают над достижением одной простой, но в то же время сложной цели — предоставлять слушателям правильный контент в правильное время.

Наш путь к машинному обучению начался с ошибки: в первое время мы не до конца понимали, как вписать задачу «правильный контент в правильное время» в общую цель — создавать идеальный опыт прослушивания музыки для пользователя.

В год запуска Spotify магистрант Королевского технологического института в Стокгольме Эрик Бернхардссон пришел в компанию, чтобы дописать свою диссертацию. Будучи студентом, он увидел потенциал в предоставлении пользователям индивидуальных рекомендаций, которые получались путем массового умножения матриц.

В то время в ходу был механизм «Совместной фильтрации», созданный пользователями Spotify. Он работает так: большое число пользователей помещает одни и те же треки рядом друг с другом в похожие плейлисты снова и снова. Мы понимаем: это говорит, во-первых, о том, что эти треки хорошо сочетаются, а во-вторых, подсказывает, что в них, вероятно, есть что-то общее. Затем подключаются алгоритмы: они вычисляют, насколько похожи две дорожки математически.

Но в то время провести подобный анализ с таким большим набором данных, как наш, было невероятно сложно. К тому же, рекомендация новой музыки слушателям казалась не только сложной, но и второстепенной задачей.

Изменения рынка и смена планов

Хотя задача рекомендации новой музыки слушателям казалась второстепенной, мы не отказывались от нее полностью. Мы передали часть работы по анализу данных стартапу The Echo Nest из Массачусетса, сопроводив задачи нашими рекомендациями. Это стало базой для первого урока нашей продуктовой стратегии.

Урок №1: Создавайте продукт для себя, но помните о других.

Мы создали инструмент, который формировал идеальный опыт только у одного типа пользователей — больших знатоков музыки. Таких же, как мы. Это должны были быть люди с энциклопедическими знаниями о группах и жанрах, которые бы следили за последними релизами, любили часами рыться в каталоге и тщательно составлять плейлисты.

Но чтобы продолжать расти, нам нужно было найти способы привлечь на платформу больше «обычных» слушателей.

К 2011 году мы поняли, что рынок постепенно переключается от практики «курирования» пользователя в пользу сервисов, основанных на рекомендациях — тех сервисов, которые делали бы большую часть работы за слушателя — и начали ускоряться. Мы поняли, что рекомендации должны стать частью нашей основной стратегии.

У нас было одно невероятно ценное преимущество, которого не было ни у кого другого — библиотека из миллионов плейлистов, которая уже тогда, возможно, была самой большой музыкальной базой данных в истории. Сегодня она насчитывает более 4 миллиардов плейлистов и растет каждую минуту.

Научить алгоритм понимать музыку

У этой базы данных были свои проблемы: данные были недостаточно «чистыми», чтобы предотвратить неожиданно всплывающие песни и создать действительно качественное взаимодействие с пользователем, которое казалось бы ему разумным и адекватным.

Урок №2: для создания отличного продукта на основе машинного обучения вам нужно хорошо разбираться в ваших данных.

Проблема механизма «совместной фильтрации» заключается в том, что он на самом деле не «слушает» музыку и не понимает ее. Он просто описывает, как часто один трек появляется рядом с другим.

Стартап The Echo Nest использовал алгоритмы машинного обучения, чтобы попытаться понять музыку так, как ее понимают люди. Один алгоритм пытался понять, как люди описывают музыку, которую слушают — какие слова для этого используют. Для этого Echo Nest сканировали блоги, обзоры, и любые другие материалы, а после обрабатывали. Например, одного исполнителя постоянно описывают с помощью слов «jangle pop», а других нет, тогда система учится ассоциировать этот термин с этим конкретным исполнителем.

Так мы могли видеть связи между музыкантами с точки зрения того, как их описывают, а также замечать артистов, которых часто описывают похожими словами или музыкальными терминами. Вторая часть исследования The Echo Nest была посвящена тому, что нельзя пометить словами, темпу и ритму, а также другим сложно описываемым аспектам музыки.

Первый персонализированный плейлист

У The Echo Nest было то, чего нам не хватало — алгоритмы, которые говорили все о самой музыке. У Spotify в свою очередь было то, чего не хватало The Echo Nest: данные о том, как люди взаимодействуют с музыкой. Много-много данных о прослушивании. Таким образом, мы подошли к третьему уроку продуктовой стратегии.

Урок №3: если у вас нет одной части уравнения внутри компании, поищите снаружи.

В 2014 году мы сделали решительный шаг и купили стартап Echo Nest. Так, наконец, получили все необходимое для запуска нашего первого machine learning продукта.

Примерно через год мы запустили Discover Weekly, наш первый плейлист, полностью сгенерированный с помощью алгоритмов: он подстраивался под каждого пользователя индивидуально. По понедельникам слушатели открывали приложение и находили там новый плейлист, составленный из треков, которые они могли пропустить в огромном каталоге Spotify.

Нам удалось решить проблему индивидуальных рекомендаций. Но только для части наших пользователей — искушенных поклонников музыки, убежденных, что ни один алгоритм никогда не сможет подстроиться под их уникальный вкус. Именно их поразила точность Discover Weekly. Но не широкую публику.

Как разработать продукт, о котором ты ничего не знаешь

Десятилетиями принцип работы менеджеров по продукту, дизайнеров и инженеров был более-менее одинаковым. Все они начинают работу с описания «каркаса» продукта: что он должен делать, как выглядеть и как работать.

Но если вы создаете продукт на основе машинного обучения, будь то беспилотный автомобиль или система рекомендаций музыки, то вы не знаете, каким будет «каркас» — вы можете только предположить, потому что знаете, например, как ездят обычные автомобили или как люди рекомендуют музыку друг другу.

Урок №4: В мире машинного обучения вы изучаете продукт, а не создаете его.

Вместо того, чтобы описывать четкую структуру или спецификацию, менеджеры по продукту должны найти массу примеров того, как этот продукт должен себя вести. Затем инженеры машинного обучения тестируют эти примеры и смотрят, насколько точно их система соответствует этим данным и прогнозирует их в другом масштабе.

Плейлисты под настроение и новые возможности

В 2013 году Spotify приобрела Tunigo — приложение, редакторы которого собирали саундтреки к тому, чем вы можете заняться под музыку — другими словами то, что при разработке продукта мы называем «сценариями использования». Это были плейлисты с названиями «Энергичный бег», «Музыка, чтобы сфокусироваться», «Ужин с друзьями», «Ваша любимая кофейня» — по сути, условия, позволяющие любому пользователю перемещаться по музыкальному каталогу и изучать его.

Редакторы замечали особенности повседневной жизни людей, которые не смогли уловить даже самые сложные алгоритмы, анализирующие схожесть песен или характеристики звука. И поскольку Tunigo был создан с использованием API Spotify, мы знали, насколько популярны их плейлисты у массового пользователя — того самого, которого мы пытались охватить. Это слушатели, которые любят музыку, но не разбираются в жанрах и терминах и не хотели бы тратить время на составление плейлистов, а хотели бы просто больше слушать подходящую музыку.

К 2015 году мы выработали два совершенно разных инструмента для рекомендаций: персонализированные, алгоритмически сгенерированные плейлисты, например, Discover Weekly для заядлых любителей музыки, и плейлисты с «саундтреками» для различных ситуаций и настроений, курируемые редакторами.

Чтобы найти большую аудиторию для «ситуативных» плейлистов, каждый из них должен был удовлетворять общие интересы, но не быть слишком персонализированным. И наоборот, плейлисты, собранные с помощью алгоритма, могли удовлетворить отдельных пользователей, но таким плейлистам не хватало глубины и понимания ситуации, в которой находится пользователь.

Позже мы придумали новый подход. Когда вы думаете о плейлисте как о продукте, а о редакторе как о менеджере продукта — источнике «тестового набора», на котором будет учиться алгоритм — машинное обучение сможет обеспечить действительно персонализированный сеанс прослушивания.

Так родился подход, который можно назвать и алгоритмическим, и редакционным. У нас мы его называем "algotorial".

0
15 комментариев
Популярные
По порядку
Написать комментарий...

Сервис хороший, но непонятно почему нет бесконечного подстраиваемого на лету плейлиста, как, например, "Flow" в Deezer или личного радио в яндекс музыке? Среди предложений такое не набирало большого количество плюсов, в частности из-за того, что пользователям и так норм.
А это новая фича может прибавить значительного веса спотифаю, особенно при его маркетинге "лучших рекомендаций". Ведь немного вяло смотрится такое позиционирование наравне с тем, что персонализированные плейлисты только раз в неделю появляются.

3

Да. С рекомендациями как-то стремно стало. Года три назад рекомендовало новую музыку, а теперь крутит по кругу одно и тоже ао всех шести плейлистах дня.

1

Плюсую, когда он только появился в РФ и не знал меня вообще - было интереснее по рекомендациям. А сейчас, на главной либо почти одинаковые плейлисты с одними и теми же треками, либо плейлисты, которые я точно не буду слушать. Сейчас хоть подкастами чуть разбавляет. Это меня разочаровало, хотя пользовался с самого прихода. Вот решил попробовать Яндекс.Музыку, так как станцию подарили и, пока что, этот сервис лучше по ощущениям, правда интерфейс и логика работы мне не нравятся...

0

Вот это - моя главная претензия к Spotify, которую решили, кажется, все альтернативные сервисы, кроме самого Spotify

0

Сервис рекомендаций никакой не умный. Сколько ни блокируй треки с одних и тех же альбомов, на следующей неделе будут другие треки с тех же альбомов. (При этом, я не хочу блокировать самих исполнителей.) Система не понимает разницу между "не прослушал или прослушал не до конца" и "заблокировал или заблокировал, не слушая".

2

С помощью апишки спотифая новые релизы я получаю теперь не по пятницам:D, а вот попытка на основе 1000 треков в любимом "скорить" треки в новых релизах пока терпит неудачу:(

1

Я тоже использую бот в Телеграме. И уведомления о новых релизах приходят мне в среду и четверг. Но вот только при переходе в Спотифай раньше пятницы их послушать нельзя — «утоплены» как недоступные.

0

Попользовался немного Спотиком, ранее Ютюб Мьюзик. Сейчас Deezer HIFI, потому что нужен был лосслесс под новые наушники. Что могу сказать - везде примерно одинаково. Ютюб так же давал классные песни, но его пришлось бросить за отсутствие хайфая. Deezer меня устраивает более чем своими подборками, Открытия Понедельника люблю больше всего, так как музыку слушаю примерно раз в неделю)
Так что выбирайте любой сервис, который нравится, тут невозможно ошибиться.

0

После пары месяцев бесплатного пользования так и не получил ожидаемого уровня рекомендаций.
Ничем по сути не лучше конкурентов а в иных компонентах ещё и хуже

0

Все чудеса машинного обучения и важность разработки "как для себя" в итоге родили фиговый рекомендательный сервис.
В моих плей-листах и лайках нет ни одной отечественной композиции. Почему мне постоянно, уже больше года, рекомендуются в "Топовых плейлистах" русские роки, русские нулевые, местные хип-хоп - дарования и прочее (для меня) говно? Гугл таких элементарных косяков не допускал.
И вторая часть вопроса - почему я не могу удалить блок с этим говном с главного экрана? Это такая изощренная пытка?
Почему львиная доля рекомендаций в конце моих плей-листов содержит треки исполнителей из этих плей-листов? Ценность таких рекомендаций нулевая.
И да, ваши рекомендации ничем не лучше аналогичных сервисов конкурентов. А такой статьей маркетологи затыкают дыры в разработке.

0

Возможно, ответ в том, что топовые плейлисты делаются не для человека, а для страны. Это как Радар новинок. Русским аккаунтам он выдаётся в смеси с русскими исполнителями. Но можно ведь найти американский Радар новинок, лайкнуть его и слушать именного его из своей библиотеки плейлистов.

0

Ну вот, кстати, Радар новинок у меня без русских исполнителей.
А избавиться от рекомендации русских плей-листов на главной странице невозможно.

0

Это ваш личный Радар. А общий Радар как раз с русскими. И да, русские плейлисты есть на главной, но не бросаются в глаза. Видимо, там есть «общегосударственные» части главной для всех.

0

Echo Nest эхо нестом но загнал меня в пузырь автоматических рекомендаций Спотифай всего за два месяца. К этому времени мне стало понятно, что любые _полностью_ автоматические рекомендации не работают. Поэтому сделал себе приложение Spotify Uncharted, чтобы хоть как-то влиять на этот процесс – попробуйте, может быть, понравится.

0

Топ рекомендации только у Пандоры.

0
Читать все 15 комментариев
Мы сделали бот, который печатает и отправляет ваши фото маме. В 2 клика
Катя со свежими фотками для родителей

Мы запустили Kind Bot — доброго бота, которому в 2 клика можно скинуть свои фотки. Он их напечатает и отправит по почте вашей маме. Или другому близкому человеку.

ТОП-17 ошибок, которые съедают конверсию лендинга на завтрак
Новый пролетариат

Очень давно один из классиков написал ёмкую по тогдашним временам фразу «пролетариату нечего терять, кроме своих цепей» Сейчас сложно понять её суть, но тогда она была понятна всем. Рабочий обладал только своими «руками» и это было единственное, чем он владел, абсолютное большинство жило от зарплаты до заплаты в арендованном жилье и не обладала…

Возник по просьбе бразильских банкиров и стал любимым напитком солдат во время Второй мировой: история Nescafe Статьи редакции

В 2021 году Nescafe — крупнейшее подразделение Nestle и бренд, который оценивается больше чем в $20 млрд. По собственным данным компании, в мире каждую секунду выпивают более 5000 чашек напитка.

Дегустация Nescafe National Museum
Из науки в IT: как создать свой стартап и стать преподавателем

Как перейти в IT из другой сферы? Как разработать курс, которому нет аналогов? Как студенту получить максимум пользы от занятий? Рассказывает преподаватель OTUS Сергей Окатов, руководитель курсов «Kotlin Backend Developer» и «Kotlin Developer. Basic».

Опыт возврата денег за обучение дизайну у Yakovlevv.com. Тварь я дрожащая или право имею?

В данной статье приведен мой личный опыт покупки данных курсов, мои оценочные суждения, а также сухие факты, в виде скриншотов и аудиозаписей из моей личной переписки с владельцем этих самых курсов, на тот момент исполняющего услуги как ИП Яковлев Виталий Борисович ( ОГРНИП: 319784700156839 ), сейчас же, работающего от лица ФОП Торб'як Тетяна…

Как у меня украли 600 тысяч с карты, а «Тинькофф» нарушает федеральный закон

Спойлер: я не вводил никуда код, не переходил по ссылкам и не сообщал данные карты.

Что Tele2 предлагает клиентам в «черную пятницу»

На главной распродаже года клиентов компании ждут сразу несколько интересных предложений: скидки на смартфоны, пакеты SMS и безлимитный трафик на YouTube, Яндекс.Карты, Яндекс.Навигатор.

Как меня хейтили десятки тысяч человек. Взрывной PR, кому он нужен
Бизнес — как ребенок: как мамы совмещают свое дело с заботой о детях

Как совмещать бизнес и семью? Ко Дню матери своими историями поделились бизнесвумен, которые работают c ЮKassa и занимаются детьми. Читайте, как им удается сохранять жизненный баланс и добиваться успеха.

Завод по производству идей. Как работают акселераторы, зачем они нужны стартапам и куда идти с идеей прямо сейчас

По данным Startup Genome, 9 из 10 стартапов терпят неудачу. Возможных причин «смерти» много: недостаточно протестированная гипотеза, неподтвержденная юнит-экономика, неверная стратегия или просто неудача в подходе к продажам.

null