Big data в музыкальной индустрии — добро или зло?

Как автор курса по менеджменту AI&BigData-продуктов и ведущий Telegram-канала про AI — я решил поделиться с вами расследованием про нюансы музыкальной индустрии 😉

Давно прошедшим 1 ноября 2018 года в лондонском клубе Underground состоялся примечательный концерт - первый в европейском турне лос-анджелесской группы Threatin. По свидетельству очевидцев, сессионные музыканты были хороши, а сам Threatin (единственный, собственно, член коллектива) отыграл сет весьма старательно. Нюанс, однако, состоял в том, что в зале было ровно три купивших билет слушателя - из почти трех сотен заявленных менеджером исполнителя. Что явилось неприятным сюрпризом для всех причастных - кроме, собственно, самого Threatin, без проблем оплатившего гарантию клубу (эдакий Томми Вайсо из мира музыки). Мало того, дальше он успел отыграть еще как минимум два концерта в Великобритании с еще более оглушительным успехом (суммарная аудитория - один человек), прежде чем оборвать турне.

Нюанс, однако, состоял в том, что в зале было ровно три купивших билет слушателя - из почти трех сотен заявленных менеджером исполнителя

История, разумеется, немало впечатлила музыкальных журналистов, и они провели расследование. Выяснилось, что все фанаты исполнителя в его фейсбуке и ютубе - купленные оптом бразильские боты. Мало того, фейками оказались также его менеджер, концертное агентство и лейбл. Всем им он создал натурально выглядящие сайты и даже придумал кучу несуществующих "подписанных" музыкантов и групп с "реалистичными" названиями типа Curve и Sunrise Station. И даже фейковое музыкальное СМИ! И все эти удивительные чудеса позволили ему забронировать полноценный тур из 10 концертов от Лондона до Бергамо.

Куда вообще смотрели концертные менеджеры клубов? И какое это все имеет отношение к big data? Давайте разбираться.

Что делает ML в музыкальной индустрии

Подразделение A&R (исполнители и репертуар) - скаутский отдел лейблов. Традиционно в своей работе эти ребята используют три инструмента:

  • связи и знакомства
  • ноги
  • чуйку

Связи позволяют вовремя узнать, что где-то появился новый подающий надежды музыкант. Ноги приводят в какой-нибудь маленький клуб или паб, где он выступает. Ну а чуйка уже позволяет понять, "Битлз" это или так. А если сразу не позволяет - снова ноги, еще пара выступлений, наблюдение за слушателями - есть ли постоянная аудитория, приводит ли она друзей и знакомых, и вообще пришла она именно послушать конкретную музыку или просто офис рядом.

Раньше эта схема вполне работала: площадок ограниченное количество, они сами проводят какую-то работу по предварительному отбору, да и все друг друга знают - в итоге можно более-менее уверенно находить потенциальных звезд. Spotify и подобные платформы мешают карты: терабайты их хранилищ безбрежны, любой может туда залить что угодно, а сами исполнители зачастую и не пытаются выйти из "гаражно-кухонного" статуса, довольствуясь маленькой аудиторией и сотней долларов в месяц с Patreon: концерты требуют денег на гарантию площадке и, возможно, сессионных музыкантов, а вероятность выхлопа крайне низка. Ну а переслушать их всех в ручном режиме, рассчитывая на чуйку, когда на том же Spotify каждый день появляется 40 тысяч новых записей, невозможно.

Spotify и подобные платформы мешают карты: терабайты их хранилищ безбрежны, любой может туда залить что угодно, а сами исполнители зачастую и не пытаются выйти из "гаражно-кухонного" статуса

Так образовалась очевидная ниша для применения big data и ML. Один из разработчиков подобного решения Chartmetric в своем блоге довольно подробно его описывает. Если пересказать это максимально просто и примитивно, получится как-то так:

  • у каждого исполнителя случается эдакая органическая точка начала отсчета метрики - релиз трека или альбома;
  • за ним почти всегда следует приток слушателей, но он говорит не о качестве музыки, а о PR-способностях музыканта (пришли друзья и знакомые, а может он еще и потратился на рекламу)
  • а вот дальнейшее поведение метрики наглядно показывает, понравилось ли людям услышанное. Если да - они будут лайкать, шерить и репостить, придут новые, им тоже понравится - и метрика полетит вверх, появится "снежный ком".

Вот пример типичного взлета из того же блога, где видны и релиз, и первый этап, и "снежный ком":

Big data в музыкальной индустрии — добро или зло?

Очевидно, что такая явная динамика будет наблюдаться только на первом хите, но ведь A&R именно это и нужно - скаут должен успеть подписать артиста, пока этого не сделали другие. А поскольку оценивается именно динамика, а не абсолютные цифры, шансы появляются даже у тех, кто ну совсем вообще не обладает никакими навыками самораскрутки и категорически никому не известен, кроме трех друзей, мамы, сестры и собаки.

Кроме базового сценария, анализ больших данных позволяет решать и другие прикладные задачи - например, выбор для тура страны, где больше всего свежих фанатов; или подбор фестивального лайнапа, способного привлечь много зрителей и никого не раздражать.

Ну а также очевидно, что подобные алгоритмы позволят вычислять артистов типа Threatin еще на дальнем подходе - хотя, справедливости ради, его-то можно было бы раскусить и по-старинке, просто потратив минут 15 на изучение "фан-базы".

Это успех?..

Плодовитый мультижанровый талант

Прежде чем радоваться победе умных машин над хитрыми музыкальными дельцами, давайте познакомимся с еще одной историей - на сей раз вполне настоящего, судя по всему действительно талантливого исполнителя по имени Халид. В ротацию он попал по-старинке: скаут отсматривал популярные плейлисты Sound Cloud, и его чуйка вздрогнула при звуках музыки никому не известного парня из Техаса. Ну и завертелось.

В интервью музыкант довольно честно рассказывает о роли стриминговых сервисов в его успехе. В вольном пересказе ключевой момент звучит так:

-- Чувак, скажи, а зачем ты шарашишь такое безумное количество треков в таком безумном количестве жанров? Ты не боишься переполнить собой рынок?

-- Затем, что стриминг - это все, и в стриминге надо быть везде, во всех плейлистах от "музыка для йоги" до "треки на дискотеку реднеков". Умение попадать во все популярные плейлисты ведет к жесткой ротации на эфирных станциях, независимо от их жанровых предпочтений.

В вопросе музыкального таланта доверимся критикам, высоко ценящим творчество Халида. Но со своей стороны сложно не восхититься также и его глубокому пониманию современных технологических реалий и умению в них себя преподнести.

Ну а что будет, если такое же понимание и умение проявит Threatin? Вместо того, чтобы клепать фейковые сайты и покупать банальных ботов в ФБ, он использует их для создания "правильного" графика успеха на Spotify? А что, если это будет не Threatin с его, судя по всему, безмерным тщеславием, а кто-то совсем другой просто с жаждой денег? Насколько "умные алгоритмы" будут в состоянии его вычислить?

Вот что говорят в компании Chartmetric:

Вообще, лучше об этом спросить сами лейблы, ведь в конце концов именно они подписывают новых музыкантов… Кажется, обнаружить обман не так уж и сложно. Если лейбл подписывает музыканта исключительно на основе цифр и в отрыве от контекста, вряд ли он долго проживет.

Наши инструменты A&R относительно молоды, созданы только осенью 2019-го, поэтому мы пока находимся в процессе настройки алгоритмов и выявления настоящих признаков успеха в мире данных; учимся определять, когда “вирусные” хиты — просто следствие купленных стримов и фолловеров...

Пока мы видим, что наиболее надежным признаком успешной долгой карьеры является медленный постоянный рост всех метрик… к счастью для нас и наших клиентов, жуликам не хватает терпения для годов упорной и честной творческой работы

Что ж, посмотрим. А пока еще немного фана.

Иногда они возвращаются

Об эпичном туре, описанном в начале этого текста, журналисты узнали из фейсбука того самого клуба Underground:

Big data в музыкальной индустрии — добро или зло?

Несмотря на суровую просьбу "больше не связываться с нами по поводу шоу", реальность такова, что ровно в том же самом клубе ровно через год состоялся новый концерт того же самого Threatin! Причем с примерно тем же успехом:

​https://twitter.com/TheRamblingElf/status/1190340115538821120
​https://twitter.com/TheRamblingElf/status/1190340115538821120

Пришло 12 человек, все журналисты. Впрочем, на сей раз исполнитель уже отыгрывал роль "фейковой группы", с манекенами на сцене, демонстративным непопаданием в фонограмму, демонстративным же ее отключением и прочими веселыми фокусами. А в дальнейшем пространном интервью рассказал, что все так и было задумано изначально: мол, вся музыкальная индустрия держится на фейках и пустом тщеславии, а промоутеры готовы поверить в любую чушь, если слышат про "лайки", "шеры" и "фолловеров". И все это делается ради фильма (да, Томми!).

Ну что ж, вполне возможно.

В любом случае, очевидно, что big data в музыкальной индустрии - это данность, и это надолго. Остается надеяться, что компаний и ML-алгоритмов будет достаточно много, чтобы и талантов выискивать, и обманщиков вычислять.

А теперь опрос:

🤔 Как вы относитесь к тому, что завтрашних звезд будут находить алгоритмы?
Отлично, это прогресс, станет меньше чьих-то сынков и подружек!
Печально, вся музыка станет одинаковой и будет соответствовать вкусам неискушенных масс.
1919
2 комментария

Прикольный хак, ну и не стыдно забрать сколько-то денег от лейблов-правообладателей, всё равно все доходы музыкантов они себе забирают...

2
Ответить

Интересная модель, но как не очень тривиальную задачу подбора лайнапа будет решать? Условный плейлист конкретного пользователя разбавить новичками - наверно да, а выстроить логистику и даты туров множества команд, по-моему пока из разряда фантастики.

И опрос странный) как минимум потому, что алгоритм все же не будет определять, станет ли раз поднявшийся на локальном хайпе исполнитель "звездой" 

1
Ответить