Big data в музыкальной индустрии — добро или зло?
Как автор курса по менеджменту AI&BigData-продуктов и ведущий Telegram-канала про AI — я решил поделиться с вами расследованием про нюансы музыкальной индустрии 😉
Давно прошедшим 1 ноября 2018 года в лондонском клубе Underground состоялся примечательный концерт - первый в европейском турне лос-анджелесской группы Threatin. По свидетельству очевидцев, сессионные музыканты были хороши, а сам Threatin (единственный, собственно, член коллектива) отыграл сет весьма старательно. Нюанс, однако, состоял в том, что в зале было ровно три купивших билет слушателя - из почти трех сотен заявленных менеджером исполнителя. Что явилось неприятным сюрпризом для всех причастных - кроме, собственно, самого Threatin, без проблем оплатившего гарантию клубу (эдакий Томми Вайсо из мира музыки). Мало того, дальше он успел отыграть еще как минимум два концерта в Великобритании с еще более оглушительным успехом (суммарная аудитория - один человек), прежде чем оборвать турне.
История, разумеется, немало впечатлила музыкальных журналистов, и они провели расследование. Выяснилось, что все фанаты исполнителя в его фейсбуке и ютубе - купленные оптом бразильские боты. Мало того, фейками оказались также его менеджер, концертное агентство и лейбл. Всем им он создал натурально выглядящие сайты и даже придумал кучу несуществующих "подписанных" музыкантов и групп с "реалистичными" названиями типа Curve и Sunrise Station. И даже фейковое музыкальное СМИ! И все эти удивительные чудеса позволили ему забронировать полноценный тур из 10 концертов от Лондона до Бергамо.
Куда вообще смотрели концертные менеджеры клубов? И какое это все имеет отношение к big data? Давайте разбираться.
Что делает ML в музыкальной индустрии
Подразделение A&R (исполнители и репертуар) - скаутский отдел лейблов. Традиционно в своей работе эти ребята используют три инструмента:
- связи и знакомства
- ноги
- чуйку
Связи позволяют вовремя узнать, что где-то появился новый подающий надежды музыкант. Ноги приводят в какой-нибудь маленький клуб или паб, где он выступает. Ну а чуйка уже позволяет понять, "Битлз" это или так. А если сразу не позволяет - снова ноги, еще пара выступлений, наблюдение за слушателями - есть ли постоянная аудитория, приводит ли она друзей и знакомых, и вообще пришла она именно послушать конкретную музыку или просто офис рядом.
Раньше эта схема вполне работала: площадок ограниченное количество, они сами проводят какую-то работу по предварительному отбору, да и все друг друга знают - в итоге можно более-менее уверенно находить потенциальных звезд. Spotify и подобные платформы мешают карты: терабайты их хранилищ безбрежны, любой может туда залить что угодно, а сами исполнители зачастую и не пытаются выйти из "гаражно-кухонного" статуса, довольствуясь маленькой аудиторией и сотней долларов в месяц с Patreon: концерты требуют денег на гарантию площадке и, возможно, сессионных музыкантов, а вероятность выхлопа крайне низка. Ну а переслушать их всех в ручном режиме, рассчитывая на чуйку, когда на том же Spotify каждый день появляется 40 тысяч новых записей, невозможно.
Так образовалась очевидная ниша для применения big data и ML. Один из разработчиков подобного решения Chartmetric в своем блоге довольно подробно его описывает. Если пересказать это максимально просто и примитивно, получится как-то так:
- у каждого исполнителя случается эдакая органическая точка начала отсчета метрики - релиз трека или альбома;
- за ним почти всегда следует приток слушателей, но он говорит не о качестве музыки, а о PR-способностях музыканта (пришли друзья и знакомые, а может он еще и потратился на рекламу)
- а вот дальнейшее поведение метрики наглядно показывает, понравилось ли людям услышанное. Если да - они будут лайкать, шерить и репостить, придут новые, им тоже понравится - и метрика полетит вверх, появится "снежный ком".
Вот пример типичного взлета из того же блога, где видны и релиз, и первый этап, и "снежный ком":
Очевидно, что такая явная динамика будет наблюдаться только на первом хите, но ведь A&R именно это и нужно - скаут должен успеть подписать артиста, пока этого не сделали другие. А поскольку оценивается именно динамика, а не абсолютные цифры, шансы появляются даже у тех, кто ну совсем вообще не обладает никакими навыками самораскрутки и категорически никому не известен, кроме трех друзей, мамы, сестры и собаки.
Кроме базового сценария, анализ больших данных позволяет решать и другие прикладные задачи - например, выбор для тура страны, где больше всего свежих фанатов; или подбор фестивального лайнапа, способного привлечь много зрителей и никого не раздражать.
Ну а также очевидно, что подобные алгоритмы позволят вычислять артистов типа Threatin еще на дальнем подходе - хотя, справедливости ради, его-то можно было бы раскусить и по-старинке, просто потратив минут 15 на изучение "фан-базы".
Это успех?..
Плодовитый мультижанровый талант
Прежде чем радоваться победе умных машин над хитрыми музыкальными дельцами, давайте познакомимся с еще одной историей - на сей раз вполне настоящего, судя по всему действительно талантливого исполнителя по имени Халид. В ротацию он попал по-старинке: скаут отсматривал популярные плейлисты Sound Cloud, и его чуйка вздрогнула при звуках музыки никому не известного парня из Техаса. Ну и завертелось.
В интервью музыкант довольно честно рассказывает о роли стриминговых сервисов в его успехе. В вольном пересказе ключевой момент звучит так:
В вопросе музыкального таланта доверимся критикам, высоко ценящим творчество Халида. Но со своей стороны сложно не восхититься также и его глубокому пониманию современных технологических реалий и умению в них себя преподнести.
Ну а что будет, если такое же понимание и умение проявит Threatin? Вместо того, чтобы клепать фейковые сайты и покупать банальных ботов в ФБ, он использует их для создания "правильного" графика успеха на Spotify? А что, если это будет не Threatin с его, судя по всему, безмерным тщеславием, а кто-то совсем другой просто с жаждой денег? Насколько "умные алгоритмы" будут в состоянии его вычислить?
Вот что говорят в компании Chartmetric:
Что ж, посмотрим. А пока еще немного фана.
Иногда они возвращаются
Об эпичном туре, описанном в начале этого текста, журналисты узнали из фейсбука того самого клуба Underground:
Несмотря на суровую просьбу "больше не связываться с нами по поводу шоу", реальность такова, что ровно в том же самом клубе ровно через год состоялся новый концерт того же самого Threatin! Причем с примерно тем же успехом:
Пришло 12 человек, все журналисты. Впрочем, на сей раз исполнитель уже отыгрывал роль "фейковой группы", с манекенами на сцене, демонстративным непопаданием в фонограмму, демонстративным же ее отключением и прочими веселыми фокусами. А в дальнейшем пространном интервью рассказал, что все так и было задумано изначально: мол, вся музыкальная индустрия держится на фейках и пустом тщеславии, а промоутеры готовы поверить в любую чушь, если слышат про "лайки", "шеры" и "фолловеров". И все это делается ради фильма (да, Томми!).
Ну что ж, вполне возможно.
А теперь опрос:
Прикольный хак, ну и не стыдно забрать сколько-то денег от лейблов-правообладателей, всё равно все доходы музыкантов они себе забирают...
Интересная модель, но как не очень тривиальную задачу подбора лайнапа будет решать? Условный плейлист конкретного пользователя разбавить новичками - наверно да, а выстроить логистику и даты туров множества команд, по-моему пока из разряда фантастики.
И опрос странный) как минимум потому, что алгоритм все же не будет определять, станет ли раз поднявшийся на локальном хайпе исполнитель "звездой"