Big data в музыкальной индустрии — добро или зло?
Как автор курса по менеджменту AI&BigData-продуктов и ведущий Telegram-канала про AI — я решил поделиться с вами расследованием про нюансы музыкальной индустрии 😉
Давно прошедшим 1 ноября 2018 года в лондонском клубе Underground состоялся примечательный концерт - первый в европейском турне лос-анджелесской группы Threatin. По свидетельству очевидцев, сессионные музыканты были хороши, а сам Threatin (единственный, собственно, член коллектива) отыграл сет весьма старательно. Нюанс, однако, состоял в том, что в зале было ровно три купивших билет слушателя - из почти трех сотен заявленных менеджером исполнителя. Что явилось неприятным сюрпризом для всех причастных - кроме, собственно, самого Threatin, без проблем оплатившего гарантию клубу (эдакий Томми Вайсо из мира музыки). Мало того, дальше он успел отыграть еще как минимум два концерта в Великобритании с еще более оглушительным успехом (суммарная аудитория - один человек), прежде чем оборвать турне.
Нюанс, однако, состоял в том, что в зале было ровно три купивших билет слушателя - из почти трех сотен заявленных менеджером исполнителя
История, разумеется, немало впечатлила музыкальных журналистов, и они провели расследование. Выяснилось, что все фанаты исполнителя в его фейсбуке и ютубе - купленные оптом бразильские боты. Мало того, фейками оказались также его менеджер, концертное агентство и лейбл. Всем им он создал натурально выглядящие сайты и даже придумал кучу несуществующих "подписанных" музыкантов и групп с "реалистичными" названиями типа Curve и Sunrise Station. И даже фейковое музыкальное СМИ! И все эти удивительные чудеса позволили ему забронировать полноценный тур из 10 концертов от Лондона до Бергамо.
Куда вообще смотрели концертные менеджеры клубов? И какое это все имеет отношение к big data? Давайте разбираться.
Что делает ML в музыкальной индустрии
Подразделение A&R (исполнители и репертуар) - скаутский отдел лейблов. Традиционно в своей работе эти ребята используют три инструмента:
- связи и знакомства
- ноги
- чуйку
Связи позволяют вовремя узнать, что где-то появился новый подающий надежды музыкант. Ноги приводят в какой-нибудь маленький клуб или паб, где он выступает. Ну а чуйка уже позволяет понять, "Битлз" это или так. А если сразу не позволяет - снова ноги, еще пара выступлений, наблюдение за слушателями - есть ли постоянная аудитория, приводит ли она друзей и знакомых, и вообще пришла она именно послушать конкретную музыку или просто офис рядом.
Раньше эта схема вполне работала: площадок ограниченное количество, они сами проводят какую-то работу по предварительному отбору, да и все друг друга знают - в итоге можно более-менее уверенно находить потенциальных звезд. Spotify и подобные платформы мешают карты: терабайты их хранилищ безбрежны, любой может туда залить что угодно, а сами исполнители зачастую и не пытаются выйти из "гаражно-кухонного" статуса, довольствуясь маленькой аудиторией и сотней долларов в месяц с Patreon: концерты требуют денег на гарантию площадке и, возможно, сессионных музыкантов, а вероятность выхлопа крайне низка. Ну а переслушать их всех в ручном режиме, рассчитывая на чуйку, когда на том же Spotify каждый день появляется 40 тысяч новых записей, невозможно.
Spotify и подобные платформы мешают карты: терабайты их хранилищ безбрежны, любой может туда залить что угодно, а сами исполнители зачастую и не пытаются выйти из "гаражно-кухонного" статуса
Так образовалась очевидная ниша для применения big data и ML. Один из разработчиков подобного решения Chartmetric в своем блоге довольно подробно его описывает. Если пересказать это максимально просто и примитивно, получится как-то так:
- у каждого исполнителя случается эдакая органическая точка начала отсчета метрики - релиз трека или альбома;
- за ним почти всегда следует приток слушателей, но он говорит не о качестве музыки, а о PR-способностях музыканта (пришли друзья и знакомые, а может он еще и потратился на рекламу)
- а вот дальнейшее поведение метрики наглядно показывает, понравилось ли людям услышанное. Если да - они будут лайкать, шерить и репостить, придут новые, им тоже понравится - и метрика полетит вверх, появится "снежный ком".
Вот пример типичного взлета из того же блога, где видны и релиз, и первый этап, и "снежный ком":
Очевидно, что такая явная динамика будет наблюдаться только на первом хите, но ведь A&R именно это и нужно - скаут должен успеть подписать артиста, пока этого не сделали другие. А поскольку оценивается именно динамика, а не абсолютные цифры, шансы появляются даже у тех, кто ну совсем вообще не обладает никакими навыками самораскрутки и категорически никому не известен, кроме трех друзей, мамы, сестры и собаки.
Кроме базового сценария, анализ больших данных позволяет решать и другие прикладные задачи - например, выбор для тура страны, где больше всего свежих фанатов; или подбор фестивального лайнапа, способного привлечь много зрителей и никого не раздражать.
Ну а также очевидно, что подобные алгоритмы позволят вычислять артистов типа Threatin еще на дальнем подходе - хотя, справедливости ради, его-то можно было бы раскусить и по-старинке, просто потратив минут 15 на изучение "фан-базы".
Это успех?..
Плодовитый мультижанровый талант
Прежде чем радоваться победе умных машин над хитрыми музыкальными дельцами, давайте познакомимся с еще одной историей - на сей раз вполне настоящего, судя по всему действительно талантливого исполнителя по имени Халид. В ротацию он попал по-старинке: скаут отсматривал популярные плейлисты Sound Cloud, и его чуйка вздрогнула при звуках музыки никому не известного парня из Техаса. Ну и завертелось.
В интервью музыкант довольно честно рассказывает о роли стриминговых сервисов в его успехе. В вольном пересказе ключевой момент звучит так:
-- Чувак, скажи, а зачем ты шарашишь такое безумное количество треков в таком безумном количестве жанров? Ты не боишься переполнить собой рынок?
-- Затем, что стриминг - это все, и в стриминге надо быть везде, во всех плейлистах от "музыка для йоги" до "треки на дискотеку реднеков". Умение попадать во все популярные плейлисты ведет к жесткой ротации на эфирных станциях, независимо от их жанровых предпочтений.
В вопросе музыкального таланта доверимся критикам, высоко ценящим творчество Халида. Но со своей стороны сложно не восхититься также и его глубокому пониманию современных технологических реалий и умению в них себя преподнести.
Ну а что будет, если такое же понимание и умение проявит Threatin? Вместо того, чтобы клепать фейковые сайты и покупать банальных ботов в ФБ, он использует их для создания "правильного" графика успеха на Spotify? А что, если это будет не Threatin с его, судя по всему, безмерным тщеславием, а кто-то совсем другой просто с жаждой денег? Насколько "умные алгоритмы" будут в состоянии его вычислить?
Вот что говорят в компании Chartmetric:
Вообще, лучше об этом спросить сами лейблы, ведь в конце концов именно они подписывают новых музыкантов… Кажется, обнаружить обман не так уж и сложно. Если лейбл подписывает музыканта исключительно на основе цифр и в отрыве от контекста, вряд ли он долго проживет.
Наши инструменты A&R относительно молоды, созданы только осенью 2019-го, поэтому мы пока находимся в процессе настройки алгоритмов и выявления настоящих признаков успеха в мире данных; учимся определять, когда “вирусные” хиты — просто следствие купленных стримов и фолловеров...
Пока мы видим, что наиболее надежным признаком успешной долгой карьеры является медленный постоянный рост всех метрик… к счастью для нас и наших клиентов, жуликам не хватает терпения для годов упорной и честной творческой работы
Что ж, посмотрим. А пока еще немного фана.
Иногда они возвращаются
Об эпичном туре, описанном в начале этого текста, журналисты узнали из фейсбука того самого клуба Underground:
Несмотря на суровую просьбу "больше не связываться с нами по поводу шоу", реальность такова, что ровно в том же самом клубе ровно через год состоялся новый концерт того же самого Threatin! Причем с примерно тем же успехом:
Пришло 12 человек, все журналисты. Впрочем, на сей раз исполнитель уже отыгрывал роль "фейковой группы", с манекенами на сцене, демонстративным непопаданием в фонограмму, демонстративным же ее отключением и прочими веселыми фокусами. А в дальнейшем пространном интервью рассказал, что все так и было задумано изначально: мол, вся музыкальная индустрия держится на фейках и пустом тщеславии, а промоутеры готовы поверить в любую чушь, если слышат про "лайки", "шеры" и "фолловеров". И все это делается ради фильма (да, Томми!).
Ну что ж, вполне возможно.
В любом случае, очевидно, что big data в музыкальной индустрии - это данность, и это надолго. Остается надеяться, что компаний и ML-алгоритмов будет достаточно много, чтобы и талантов выискивать, и обманщиков вычислять.
А теперь опрос: