«Мы не создаём музыку»: основатель сервиса генерации звукового фона Endel о сделке с Warner Music и работе алгоритма

Приложение генерирует персональный звуковой фон, ориентируясь на время суток, погоду, пульс и шаги пользователя.

«Мы не создаём музыку»: основатель сервиса генерации звукового фона Endel о сделке с Warner Music и работе алгоритма

В конце марта 2019 года звукозаписывающая компания Warner Music подписала контракт с Endel — приложением, которое создаёт звуковой фон с помощью искусственного интеллекта.

Это первый случай, когда крупная компания начала распространять музыку, созданную алгоритмом. Партнёры договорились о том, что Endel запишет 20 альбомов для лейбла. Пять из них уже выпущены.

Альбомы основаны на различных типах сна и называются «Ясная ночь», «Дождливая ночь», «Облачный вечер», «Облачная ночь» и «Туманное утро».

Endel — берлинский стартап, которым руководит россиянин Олег Ставицкий. До переезда в Германию Ставицкий работал заместителем главного редактора журнала «Игромания», а затем руководил собственной студией мобильной разработки, где создал детское арт-приложение Bubl.

«Мы не создаём музыку»: основатель сервиса генерации звукового фона Endel о сделке с Warner Music и работе алгоритма

Приложение купила немецкая корпорация Fox & Sheep, и Ставицкий вместе с командой переехал в Берлин, где начал работать над новым проектом — Endel.

В интервью vc.ru он рассказал, как происходит взаимодействие искусственного интеллекта и человека, почему сделка с Warner Music — только эксперимент, и как изменится поведение музыкантов и потребителей.

О работе Endel

Как вам пришла идея создать Endel?

Идея жила у меня в голове давно, но не совпадали факторы: не было рынка и аудитории. На мой взгляд, за последние полтора года всё сошлось — люди готовы платить за цифровые продукты, которые делают жизнь лучше - это хорошо видно на примере успеха сервисов цифровой медитации.

С другой стороны — революция смарт-спикеров. Мы видим, что звук стал мобилен, появились беспроводные наушники, «умные» колонки. Аудиоконтент неожиданно вышел на первое место.

И, наконец,— сумасшедший стресс, вызванный информационным перегрузом. Все эти факторы совпали, и я подумал, что пришло время сделать такой продукт. Раньше мы бы не привлекли в него инвестиции и, скорее всего, он бы не зарабатывал так, как зарабатывает сейчас.

Расскажи подробнее, как работает приложение. Алгоритмы подбирают музыку под место и погодные условия пользователя, выбирая из пяти уже созданных альбомов? То есть алгоритмы не генерируют уникальную музыку с нуля под каждого человека?

Вы смешали то, что делает мобильное приложение, и партнёрство с Warner Music.

Алгоритм в реальном времени генерирует звуковой фон исходя из вашего пульса, погоды за окном, времени суток, движения, количества шагов. И если данные меняются, алгоритм реагирует и соответственно адаптирует звук фон меняется. Это то, над чем мы работаем.

Те пять альбомов, которые уже вышли, и ещё 15 альбомов — это статичные версии. Мы записали работу алгоритма, задав определённые значения тем параметрам, на основе которых он генерирует звук, и смогли получить 20 различных состояний. Например: «Ранее утро, дождь, я хочу спать» или «День, солнечно, я хочу сфокусироваться».

На основе этих комбинаций мы сгенерировали 20 альбомов, передали их Warner Music, и они теперь занимается дистрибуцией этих альбомов.

Как проходит взаимодействие алгоритма и композиторов?

У нас есть огромная библиотека семплов — маленьких звуков, которые создаёт наш композитор. Он их создаёт, размечает определённым образом и загружает в нашу систему.

Система вбирает в себя вводные: данные о погоде и прочем. Далее алгоритм выбирает из библиотеки те семплы, которые подходят человеку под все его вводные. Затем всё склеивается, накладываются аудиоэффекты, основанные на исследованиях о том, как определённые частоты влияют на когнитивные функции человека.

Такой композиторский подход не новый, его использовали Филип Гласс и Стив Райх в 1970-х годах. Они создавали некую систему, а она начинала жить и развиваться по своим законам.

Мы применили новые технологии к этому подходу: до сегодняшнего дня никто не скрещивал современные возможности понимания контекста человека с подобным творческим методом.

Также мы применили последние исследования о том, как определённые частоты, лады и музыкальные фразы влияют на когнитивное состояние человека.

Это не просто какие-то звуки: они влияют на человека определённым образом, но в разное время. Нет такой композиции или частоты, которая работала бы для человека всегда — в любое время года, суток и так далее.

На каких выборках вы обучали алгоритм? Использовали ли произведения каких-то композиторов как эталон?

Нет, у нас есть композитор Дмитрий Евграфов — сооснователь Endel, который и создаёт произведения для сервиса. У него были концерты по всему миру, он состоявшийся композитор. Один из его треков использовали в телепрограмме «The Grand Tour», которая выходит на Amazon.

В каких случаях стоит обратиться к композитору, а в каких — к алгоритму? Для каких задач важна именно автоматическая генерация музыки?

Я не верю, что сегодня есть искусственный интеллект, способный написать музыку, которую можно было бы слушать всерьёз. Если не говорить о фоновой композиции, которая может звучать, например, в стриме.

Если говорить про музыку, то без человека, на мой взгляд, не обойтись. Я слышал, как работают практически все алгоритмы, которые делают музыку, и не верю в это.

То, что мы делаем, — это не музыка. Мы не позиционируем Endel как музыку, созданную для осознанного прослушивания. Это звуковой фон, который влияет на когнитивные функции, и это его главная задача. Мы точно не ожидаем, что кто-то сядет с Endel и, сложив руки, будет слушать.

Кому принадлежат авторские права на композиции?

Права принадлежат композитору и нашим разработчикам. Мы записываем в соавторы всех, кто работал над этим звуком.

Сколько человек работает в Endel?

Всего в команде 12 человек, из них шестеро — сооснователи. Все они практически моя семья — люди, с которыми мы делали Bubl. И ещё к нам присоединились несколько ключевых людей из агентства.

«Мы не создаём музыку»: основатель сервиса генерации звукового фона Endel о сделке с Warner Music и работе алгоритма

The Verge пишет, что вы наняли стороннюю компанию для написания названий треков. Зачем?

Это ошибка. Мы наняли не стороннюю компанию, а копирайтера. Мы с ним уже работали, когда создавали описание для приложения. Мы попросили его, потому что у нас не было времени, чтобы придумывать названия для 400 треков.

Вы рассказываете о влиянии звуков на когнитивные функции человека. А с какой целью вы разработали такую штуку? Зачем?

Если откроем мобильное приложение, то увидим там три режима: «Сфокусироваться», «Расслабиться» и «Спать». Вот для этих целей мы и создали Endel — помочь людям.

Человеку достаточно сказать, чего он хочет: расслабиться, сфокусироваться или уснуть. Мы работаем не с эмоциами, а с состоянием человека.

Сколько пользователей было у Endel до сделки с Warner Music?

Честно говоря, сделка практически никак не повлияла на количество пользователей приложения. У Endel сотни тысяч установок и десятки тысяч пользователей.

На своей странице в Facebook ты написал, что Endel создана не для того, чтобы заменить музыкантов. Ты сталкивался с подобными обвинениями? Расскажи подробнее, что ты имел в виду.

Это на волне хайпа, который случился после анонса сделки. Журналисты пишут кликбейтные заголовки, люди это видят, а потом возмущаются: «А вы что, хотите настоящих музыкантов заменить?»

Это был сарказм и ирония. Любому здравомыслящему человеку понятно, что мы здесь не для того, чтобы заменить музыкантов.

Никто не позаботился о том, чтобы почитать, в чём суть анонса, и не удосужился послушать, что мы делаем. Все вырвали фразу из контекста, пришлось отшучиваться.

Про сделку с Warner Music

Расскажите о сделке с Warner Music. Кто на кого вышел первым? Долго ли шли переговоры? Я так понимаю, ваш контракт отличается от стандартных контрактов со звукозаписывающими компаниями.

Честно говоря, вся информация есть в интернете в том или ином виде, я бы не хотел фокусироваться на сделке и комментировать её. Для нас это один большой эксперимент. Мне кажется, этой сделке уделяют больше внимания, чем она заслуживает.

Могу прокомментировать, что это была идея Warner Music, они к нам пришли. По условиям сделки я бы не хотел комментировать, потому что мы об этом договаривались с партнёрами.

Эта сделка знаковая — впервые крупный лейбл будет распространять треки от алгоритма. Как ты думаешь, это может изменить поведение музыкантов или потребителей?

На рынок выходит ещё один игрок — искусственный интеллект, к которому в определённых случаях имеет смысл обращаться.

Я недавно сцепился в Twitter с оcнователем одного лейбла. Человека возмутила моя реплика в одном интервью. Он обвинял нас, что мы потенциально можем настолько автоматизировать отрасль, что лишим музыкантов работы.

Но если случится так, что наш алгоритм заменит человеку альбом, под который он годами засыпал, то извините. У нас есть звук, и он может сделать это лучше. Я думаю, что эмбиент-музыкантов, которые делали прикладную музыку, алгоритм может заменить. Но не более того.

Какие требования озвучила Warner Music, помимо той, чтобы сделать треки Endel короче 60-минутных?

Мы порезали треки на небольшие из-за того, что платформы вроде Spotify работают по определённым законам. Люди слушают музыку не альбомами, а треками — они так привыкли. Некоторые из этих треков можно включить в другие плейлисты. А часовой трек тяжело добавить в плейлист.

Других изменений не было. Для нас это был довольно безболезненный процесс: передали Warner Music контент, а они его распространяют.

Согласно условиям, авторство треков остаётся за вами, а лейбл лишь распространяет их. Какая Warner Music с этого выгода?

Как дистрибьютор они берут свой процент за распространение.

Про конкурентов и музыку будущего

В TC Disrupt несколько лет назад победил сервис Jukedeck, похожий на ваш. Как думаешь, почему вы «взлетели», а они — нет? Связано ли это с какими-то изменениями на рынке?

У нас разные ценностные предложения и пользовательские кейсы. То, что они делают, — пытаются сделать ещё с десяток компаний: автоматизировать процесс производства музыки для рекламы, роликов и так далее.

Мы — сервис для повышения продуктивности. Endel — функциональная утилитарная технология, она не пытается заменить существующий рынок музыкантов, которые пишут музыку для рекламы. Мы просто про другое.

Как думаешь, почему многих людей пугает мысль о том, что искусственный интеллект может создавать музыку?

Все готовы к тому, что искусственный интеллект может помочь человеку не ошибаться, например, посадить лучше него самолёт. А музыка — творческий процесс. И если алгоритм способен на творческий процесс, то люди начинают пугаться, что компьютеры заменят их полностью. Но это не так.

Кроме того, есть целый рынок — люди зарабатывают тем, что пишут музыку для рекламы игр. Подобным профессионалам неуютно от того, что гипотетически они могут остаться без работы.

Какой ты видишь музыку будущего?

Я верю, что она будет содержать в себе те элементы, над которыми мы сейчас работаем. Мы много чего понимаем про человека и персонализируем свой звуковой поток под него. Я не вижу причин, почему это в будущем не может произойти с музыкой.

Это не применимо ко всей музыке. Например, в хорошем хип-хопе ты восхищаешься тем, как человек подбирает рифмы — это завораживает. Не думаю, что здесь нужны технологии.

Меня завораживают любые самостоятельные системы, которые играют сами в себя.

Получается, что будущее — в том числе и искусства — за программистами? Они будут создавать искусственный интеллект, который и рисует, и поёт, и музыку пишет?

Мне обидно, когда программистов называют нетворческими людьми. Сложно представить себе более творческую профессию.

Больше всего на рынке в околомедийной среде ценятся инженеры с чувством прекрасного, которые не только программируют, но и обладают какими-то художественными навыками.

Посмотрите, что делают Sila sveta с выступлениями рэпера Drake. Трещины у него под ногами, когда он ходит по сцене, — это программный код.

В будущем мы увидим произведения искусства, в котором будут элементы искусственного интеллекта. Но это будет неинтересно, если за произведением не будет стоять человек.

У вас есть крутая технология. Нет в планах использовать её, чтобы учить писать музыку или помогать композиторам?

Писать музыку мы не будем, а вот учить — да. У нас в планах — создавать режимы для различных ситуаций. Например, для вождения. Мы уже это сделали, сейчас общаемся с автомобильными концернами, чтобы интегрировать наши разработки в машины.

Мы будем учитывать стиль вождения человека, как он разгоняется, тормозит и так далее. И генерировать под это соответствующий звуковой фон.

Нам интересно сделать так, чтобы приложение начало вести человека в течение дня. Например, запускаешь приложение утром, оно сканирует пульс, погоду, время суток, а затем предлагает в это время сфокусироваться на работе.

Потом, через два часа, приложение увидит изменения пульса, солнца и предложит расслабиться — запустит соответствующий звуковой фон. Это будет в нашем следующем обновлении.

Материал подготовлен при участии Яны Павловской.

2525
18 комментариев

При всём уважении к Олегу, но как бы он не старался, лучшим его детищем остается обзор на God of War 3.

9
Ответить

"Мне обидно, когда программистов называют нетворческими людьми. Сложно представить себе более творческую профессию."

золотые слова! =)

7
Ответить

То чувство, когда твой бывший студент достиг успеха :) Олегу удачи и дальнейшего развития!

7
Ответить

Мне понравилось вот это

"Мы будем учитывать стиль вождения человека, как он разгоняется, тормозит и так далее. И генерировать под это соответствующий звуковой фон"

Тут нужно быть осторожнее с фонами. У многих музыка провоцирует состояние СУПЕРМЕНА

2
Ответить

ага

3
Ответить
Ответить

Это конечно интересно, но что если у 90% населения наушники так себе и искажения воспроизведения мягко говоря не будут так воздействовать на когнитивные системы организма? Сфокусироваться летним днем наше тело воспримет как выпрыгни в депрессивное окно весной? Одно дело слушать в мониторах, другое дело в разных наушниках с разными АЧХ и т.д., плюс звуки все воспринимают по-разному, некоторые частоты могут вообще не различаться отдельными людьми. Короче мутноватая история (но идея занятная).

1
Ответить