Роботы в музыке: какие гипотезы тестировали стартапы в искусственном интеллекте

Весной этого года журнал The Guardian опубликовал статью, где говорится о том, что небезызвестный лейбл Warner Music подписал первый в истории контракт с алгоритмом — искусственный интеллект стартапа Endel должен написать до конца 2019 года 20 альбомов. Вот так прецедент, неужели у стартапов с хештегами #AI и #music все-таки получится?

А “получится” у стартапов — это подтвержденная гипотеза о том, что за продукт будут платить. Вернее, уже платят. И вот как это было.

Гипотеза 0 - как все начиналось или классика жанра

Генеративная музыка, как и все технологии, тоже началась с экспериментов. Из раннего, например, испанская компания Melomics Media уже с 2012 года во главе со своим суперкомпьютером Iamus пишет классические музыкальные композиции и даже целые альбомы. Но применение этому компьютеру нашлось только в области компьютерных наук в Малагском университете, где он и стоит по сей день. Н — наука. Не продается.

Гипотеза 1 - о персональной музыке

“Настало время вашего персонального саундтрека” убеждал всех Пьер Барро, основатель компании Aiva Technologies, на очередном выступлении TED в 2018 году.

Идея кажется логичной и абсурдной одновременно, но достаточно авантюрной, чтобы поднять инвестиций и хайпа под рабочий прототип и авантюрную идею.

Aiva Technologies начинали так же с классической музыки (я понятия не имею, почему, но много кто с этого начинает), но демострация таких произведений со всеми скрипками, виолончелями дает очень мощный маркетинговый эффект — впечатление.

Работает это обычно так — ИИ, сочиняя музыку, на выходе выдает midi файлы, грубо говоря, это ноты. Дальше “ноты” озвучиваются либо живыми оркестрами, либо виртуальными инструментами в специальном софте — Digital audio workstation (DAW).

Человеческая креативность не масштабируется

Пьер Барро, основатель и CEO Aiva Technologies

Например, в 2017 году на Yet Another Conference Яндекса устроили именно такое шоу — нейронная сеть написала произведение по мотивам композитора Скрябина.

И это классный элемент шоу, как в случае с примерами на TED и YAC, но за рамки перформанса, на настоящий рынок, он не выходит.

Со временем гипотеза Aiva Technologies о том, что люди будут слушать ИИ-музыку, потому что им нужно что-то персональное — не подтвердилась. Поэтому они пошли в другом направлении — создание инструментов для музыкантов, кто пишет музыку с использованием DAW.

Иными словами, алгоритм пишет “заготовки” произведений в нужном стиле и тональности, а дальше музыкант может их корректировать и создавать уникальный трек. Или использовать как есть. Где-нибудь.

Так выглядит DAW Ableton Unsplash.com
Так выглядит DAW Ableton Unsplash.com

Но дело в том, что это уже вообще другой рынок — существуют целые аудио стоки и биобиотеки таких заготовок, написанный живыми людьми. Очень много такого контента распространяется вообще бесплатно, например, есть сайт midiworld, где можно найти любимую песню и преобразовать ее в midi. И никаких тебе авторских прав.

И я, конечно, надеюсь, что все у Aiva Technologies получится, но рынок так себе, если честно.

Гипотеза 2 — реклама и видео-продакшн

Как мы знаем, деньги там, где реклама. Здесь речь пойдет о видео-рекламе с фоновой музыкой. За все приходится платить, в том числе и за музыку, и вот по какому принципу:

  • Аудио стоки — это библиотеки с композициями для коммерческого использования. Композиторы пишут разнообразную музыку и выкладывают их на стоки. Лицензия на использвоание такой музыки может варьироваться от $10 до бесконечности. Весь Голливуд сидит на аудио стоках, ТВ реклама, пре-роллы в Youtube тоже содержат стоковую музыку.
  • Композитор или покупка прав на известную песню — это решение для ребят с бюджетом. Привлечь “приличного” композитора в России на написание фоновой музыки будет стоить от 100 тыс. рублей, а купить лизенцию на, например, песню The Rolling Stones (и я сейчас о группе, не о журнале) обойдется в несколько миллионов.

Как вы понимаете, аудио стоки — большой рынок музыки среднего качества. При этом контента там мало, и его всегда не хватает — например, на одном из самых крупных стоков audiojungle хранится всего лишь около 500 тысяч треков.

И здесь мы опять вспоминаем об искусственном интеллекте, который генерирует фоновую музыку ровно такого же качества, нужной тональности и длительности и даже могут по референсу написать похожую.

Но что-то пошло не так, на этом, насколько мне известно, никто много не заработал. Возможно, потому что креативщики (звукорежиссеры, продюсеры, режиссеры, монтажеры и другие ребята) не создают контент линейно, а руководствуясь чувствами, настроением и так далее. Или потому, что генеративная музыка не особо облегчает их работу.

Дальше потоковая генеративная музыка начала “сваливаться” в фоновый стриминг —в киберспорт, tiktok и другие площадки (в том числе в магазинах, салонах красоты и т.д.), где требуется поток фоновой музыки. Например, подписка на фоновую музыку (то есть не написанную алгоритмом) стоит тысяч так 600 рублей в год (инсайдерская информация) для сетевых магазинов. А проект Mubert предлагает генерировать музыку за ~ 40$ в месяц.

И вроде бы есть экономическая ценность, но в этом сегменте AI опять конкурирует с настоящими музыкантами и оригинальными треками с вокалом, которого у ИИ пока нет.

Гипотеза 3, в которой робот становится медийным персонажем

Некоторые проекты пошли по неочевидному пути — через становление медийным персонажем. Например, у того же российского проекта генеративной музыки Mubert в Японии есть даже фанаты и фанатки. Получается, что алгоритм опять выходит на одну арену конкуренции с живыми музыкантами, но на этот раз в другой роли, где его недостатки стали преимуществом — среди женщин и мужчин он — единственный робот.

Конечно, Япония — страна специфическая, стоит загуглить, что у них происходит в телеэфирах и понять, что реакцию Японии не стоит экстраполировать. Однако, несмотря на легкую неадекватность хайпа в стране восходящего солнца, за ее пределами новую медийную кибер-личность тоже слушают.

И вот уж мало кто ожидал, что музыкальный AI будет использоваться по его прямому назначению — генерировать музыку для людей, чтобы они просто слушали ее. Круг замкнулся.

Таких людей не очень много, то есть рынок не очень большой. Но есть те, кому реально нужна просто фоновая музыка. Музыка, которая будет играть, пока они пишут статьи (я сейчас пишу под поток из Mubert), пишут код, рисуют, медитируют, читают книги и так далее.

Вы, наверное, подумали, так чем Mubert отличается от той же Aiva Technologies? У Mubert есть свое мобильное приложение, которое создает этот фоновую музыку в реальном времени. В случае с Aiva — вам придется зайти на сайт, нагенерить там много треков, залить на телефон и только тогда у вас будет фоновая музыка. Ничего личного, как говорится, просто мобильное приложение.

Но если подумать, раз уж можно генерировать музыку, то можно генерировать и голос. А речь генерируют лучше всех голосовые помощники. В России есть свой “медийный персонаж” — Алиса Яндекса. И у Алисы есть свой альбом, который она “выпустила” в 2017 году, в которой текст, музыка и голос полностью синтезированы.

Но пока это все-таки больше про хайп, нежели про реальный рынок.

Гипотеза 4 — а не продать ли это стриминговым сервисам?

Музыкальные стриминговые сервисы в мире работают не так, как в Apple Music и Яндекс.Музыка. Многие из них работают по ad-supported модели — музыку можно слушать бесплатно, просто периодически в наушниках будет “возникать” реклама. Избавиться от рекламы можно через платную подписку на сервис. Spotify, например, работает именно так.

Мы это делаем не ради денег

Тим Кук об Apple Music, CEO Apple

Но вот только не все так радужно со стриминговыми сервисами. Дело в том, что все они убыточные, в том числе Spotify. Разница только в том, что у остальных стриминговых сервисов есть “крыша” в виде материнской компании, и они просто держат долю рынка на случай, если ситуация изменится, и кто-нибудь все же “хакнет” этот вопрос.

Очень сложно зарабатывать деньги на музыкальных стриминговых сервсах. Большая часть денег с $10-ти подписок слушателей уходит на выплаты лейблам и артистам. Большая часть стоимости 10-долларовой ежемесячной подписки уходит артистам и лейблам

Джин Манстер
, Венчурный капиталист и партнер Loup Ventures

В 2016 году, Spotify все же попытался заработать и “получил” от Warner Music Group.

Шведский стриминговый проект (это я все еще про Spotify) создавал и продвигал плей-листы с настроенческой музыкой и/или каверами от продакшн хаусов (агентства, создающие музыку для коммерческого использования). Треки от продакшн-хаусов стоят дешевле и иногда вообще не облагаются коммисиями от прослушиваний. Поэтому такие манипуляции проводились для того, чтобы немного увеличить маржу Spotify, так как с мейджор лейблами, такими как Warner, Universal и т.д. не разгуляешься.

И кажется логичным, что на место продакшн-хаусов может встать искусственный интеллект. И тогда и стриминговые сервисы начнут зарабатывать, и ИИ-стартапы найдут свою нишу.

Но дело в том, что когда лейблы об этом узнали, они назвали Spotify предателями, стали требовать увеличить процент выплат за прослушивания, что на самом деле фатально для компании.

А фатально потому, что если Spotify увеличивает размер выплат одному из своих партнеров, например, Warner Music Group, то остальные лейблы начнут возмущаться и аппелировать к статусу Всемирной Торговой Организации — Most-Favored Nation, то есть анти-дискриминационной политике. Перевожу — “если вы поднимите выплаты одному лейблу, то повышайте выплаты другим”. И тогда Spotify окажется в не очень приятном положении.

Речь идет действительно о больших деньгах:

  • 70% всей выручки Spotify уходит на оплату комиссий правообладателям;
  • Правобладателями являются лейблы;
  • Стоимость 1 стрима стрима варьируется от $0,006 до $0,0084 — это суммы, которые перечисляются лейблам;
  • Лейблы перечисляют от 15% до, в некоторых случаях, 50% от этих средств артистам;

А теперь внезапно вспоминаем, что примерно такая же ситуация была и в видео сервисах, типа Netflix и Amazon. Тогда оказалось, что производство собственного контента приводит к большей марже, чем покупка лицензий у киностудий.

Почти “хакнули” систему, но стриминговые сервисы все-таки очень завият от лейблов.

Гипотеза 5 — Многоходовочка

Но Дениэл Эк, основатель и CEO Spotify, не отчаивается: “Сегодня артисты могут создавать и выпускать свою собственную музыку. Лейблы, студии и радио, безусловно, играют большую роль, но задача артистов — быть услышанными”.

Иными словами, вам не нужен лейбл, чтобы быть популярным музыкантом. А если музыкант избавится от лейбла, то стриминговый сервис избавится от огромных комиссий.

Сейчас музыканты, продюсеры и небольшие лейблы загружают свое творчество в Apple Music, Spotify, Pandora через сайты “агрегаторов”, например, DistroKid, Onerpm. Необходимо один раз загрузить трек на сайт агрегатора, чтобы он появился сразу на всех музыкальных площадках. Естественно, по законам природы, агрегаторы берут комиссию с выплат музыкантам, но меньше, чем лейблы.

Таким образом Spotify проводит много активностей в обучении и помощи начинающим артистам, то есть тем, кто не подписан ни на какой лейбл. Например, через платформу “Spotify for Artists” музыканты могут самостоятельно загружать свои треки напрямую в Spotify, получая комиссии за их прослушивание. Но самое интересное, что Spotify взял и купил миноритарную долю в DistroKid. Логично предположить, что с помощью своей новой “покупки” Spotify for Artists сможет распространять загруженные треки на другие платформы.

Spotify, конечно же, заявляет, что компания не собирается превращаться в звукозаписывающий лейбл, то есть музыкант будет получать выплаты за прослушивания целиком. А Spotify — свою выручку за платные подписки.

Лейблы наносят ответный удар, или как гипотеза разрешилась

А теперь вспомним начало этой статьи. Warner Music заключает контракт на создание музыки с Endel, чтобы затем ее загрузить в стриминговые платформы и получать с этого деньги. Именно то, что Spotify попытался сделать в 2016 году, теперь делает Warner Music.

Стоит отметить, что для Endel — это не ключевая сделка. Проект не создает музыку ради музыки, Endel — это mindfulness приложение, которое создает звуковое сопровождение в зависимости от пульса, погоды, местоположения пользователя, чтобы было легче концентрироваться, быть бодрым с утра и засыпать вечером. Так что их среди их партнеров — это Smart-TV, виртуальные помощники, вроде Amazon Alexa и прочие элементы “умного дома”, но не мейджор-лейблы.

Как иронична эта жизнь. Подписывайтесь на мой ироничный телеграмм канал о муках стартапов.

11
Начать дискуссию