Что происходит, когда вы решили посмотреть сериал

Какие люди и технологии стоят за бесконечной лентой фильмов и сериалов и возможностью за секунду начать просмотр.

Вы решили посмотреть сериал и зашли на главную страницу онлайн-кинотеатра. Например, ivi

Вас встретит персонализированная главная страница с «витриной». Её содержимое зависит от того, новый вы пользователь или постоянный посетитель. Например, новичок видит «заглушку» — разнообразный контент, покрывающий наиболее востребованные пользователями жанры и фильмы из каталога сервиса.

Команда машинного обучения во главе с Туралом Гурбановым уделяет особое внимание главной странице и «витрине».

Например, они разработали алгоритм, по которому на главной странице ivi нет двух одинаковых фильмов — все позиции, которые видит пользователь на первом экране без скроллов, занимает разный контент.

Это сделано, чтобы витрина не только демонстрировала разнообразие каталога, но и работала максимально эффективно, так как каждая позиция в ней — на вес золота.

Заглушка-витрина перестраивается каждый день. Также она зависит от того, из какой страны пользователь и с какого устройства он зашёл — ведь в разных странах доступен разный контент, а некоторые форматы видео удобнее смотреть на разных экранах.

Мы стараемся определять, какой контент приоритетнее на конкретных устройствах и поднимаем его выше. То, что смотрят на мобильных устройствах, может не всегда совпадать с тем, что смотрят на Smart TV. Например, на iOS и Android чаще смотрят сериалы, а на телевизорах контент выбирают более целенаправленно — это может быть фильм в компании друзей или семьи, и чаще этот контент платный.

Турал Гурбанов, руководитель отдела машинного обучения ivi

Рекомендации должны постоянно меняться

Чтобы пользователь видел самый подходящий и интересный контент, разработчики ivi создали рекомендательную систему Hydra. Каждый раз, когда пользователь совершает некоторое «полезное действие», система обновляет свое знание об интересах пользователя и в режиме реального времени генерирует для него новые персональные рекомендации.

Полезными действиями являются просмотр, оценка, покупка и добавление фильма в избранное. Помимо полезных действий, система также учитывает impressions — «взгляд пользователя на постер фильма».

Impression позволяет определить фильмы, которые пользователь увидел в рекомендациях, но по какой-то причине проигнорировал (не провзаимодействовал с ними). Если пользователь заходит несколько раз на сервис, видит один и тот же фильм и никак не взаимодействует с ним, то, скорее всего, этот фильм либо пользователю не нравится, либо он его уже посмотрел.

Hydra учитывает этот неявный сигнал для того, чтобы временно понизить приоритет «неактивным» фильмам и дать возможность другим релевантным проектам попасть на витрину.

Также на рекомендации влияют «близкие по вкусам» пользователи — похожим зрителям, чьи кино-интересы совпадают, рекомендуется похожий контент.

Пользователь может в любой момент настроить рекомендации — чаще ставить рейтинги фильмам и удалять из просмотренного то, что ему не понравилось. В будущем команда инженеров планирует добавить возможность точнее настраивать рекомендации, рассказывая системе, какие фильмы он смотрел, и какие ему понравились.

Как работает Hydra и кто её разрабатывает

Рекомендательная система очень похожа на любую другую базовую модель машинного обучения с подготовкой данных, обучением моделей, тестированием, оптимизацией и интеграцией в сервис. В случае ivi, Data Science (DS) инженеры также занимаются разработкой и поддержкой Hydra.

Команда рекомендательной системы занимается разработкой Hydra, «коннекта» с Data Lake (хранилищем данных), продуктом и аналитикой. У нас сейчас 11 человек, админ, который помогает с эксплуатацией сервиса, собственный аналитик (помимо продуктовых аналитиков), который делает более подробный анализ данных с учётом наших потребностей, тестировщики, DS инженеры и конечно разработчики.

Турал Гурбанов,


Команда Big Data собирает в Data Lake огромное количество событий о том, как пользователи взаимодействуют с сервисом. Например, множество событий-сигналов: просмотры, рейтинги, клики, избранное, список «посмотреть позже», покупки, impressions. А от устройства нужно получить информацию об операционной системе, площадке, стране.

На основе этих данных Hydra учитывает интересы пользователя и строит рекомендации. При построении рекомендаций также учитывается, является ли пользователь подписчиком, есть ли у него детский профиль и многое другое.

Нашей команде интересно именно поведение пользователя, как он реагирует на рекомендации, с чем он хочет взаимодействовать, а с чем нет.

Турал Гурбанов

В Data Lake отправляется информация о том, как пользователи относятся к различным типам монетизации. Например, если какие-то пользователи больше заинтересованы в подписочном контенте, но не покупают транзакционный, нужно это учесть и не продвигать платные фильмы, по крайней мере, показывать не так часто. Таким образом повышается удовлетворенность от сервиса, чтобы пользователь не страдал от того, что точно не будет смотреть.

Вы листаете страницу вниз — появляются разные категории и подборки

В ivi работает большая редакция, которая формирует подборки по тематикам, жанрам или событиям. Например, подбирает фильмы-кандидаты на Оскар, победителей Каннского фестиваля, группирует их по жанрам, «свежести» и так далее. Самые популярные подборки — это новинки.

Пользователь видит подборку, если в ней содержатся релевантные фильмы и она удовлетворяет бизнес-правилам. Например, в подборке должно быть не менее 5-6 фильмов. Их точное число зависит от платформы, на которой зритель запустил ivi — ведь на смартфоне можно отобразить меньше контента, и подборка для него может быть короче.

Есть и автоматическая генерация подборок — ведь редактор не может держать в голове информацию о содержимом всех подборок, доступных на сервисе на определенной платформе и в определенный момент времени. Если не учитывать всей этой информации, содержимое подборок может дублироваться, что делает их похожими друг на друга и убивает идею подборки, как уникального тематического кластера контента.

Сейчас ivi идёт к тому, чтобы у каждого пользователя подборки были персональными, то есть на лету группировались из релевантного для него контента.

Кстати, у Netflix нет идей подборок, только фильтры. Если у него рекомендации — это фильтр, который открывает список других подфильтров, то в ivi — полноценная семантическая подборка.

Вы выбрали фильм или сериал и кликнули на него

Откуда взялся этот фильм и почему нельзя всё посмотреть бесплатно

В ivi есть отдел контента, который закупает фильмы и сериалы и договаривается с правообладателями о формате распространения — с рекламой, платно или по подписке. Они учитывают, что все фильмы распределяются по «окнам»: сначала фильм выходит в кинотеатры, через 1-2 месяца правообладатель отдает фильм на платную модель распространения, в «цифровое окно». Так фильм попадает в стриминговые сервисы и цифровые магазины.

Ещё через 1-2 месяца фильм становится доступен по подписке. Через 3-4 месяца фильм может стать бесплатным для зрителей, но с рекламными блоками

Некоторые из правообладателей, как правило, самые крупные компании, не разрешают отдавать свой контент по рекламной модели из-за имиджевых рисков.

Поэтому разделение фильмов по моделям монетизации зависит от правообладателя и их требований. Одна из основных задач отдела контента — постоянно пополнять медиатеку. Новинками, классикой и с возможностью «циркуляции» фильма из платной модели в рекламную.

В целом, фильмы из подписки в рекламный формат переносятся постоянно, чтобы пополнять каталог и привлекать новых зрителей. Часто после подписки команда переводит фильм на рекламную модель, если договоренности с правообладателем позволяют это сделать.

Кстати, офлайн-доступ тоже определяется правообладателем и является одним из «бонусов» для подписчиков. Возможность скачивания фильма — это часть сложного договора с правообладателем, поэтому скачать можно не все фильмы, которые есть в подписке.

Наличие нескольких типов монетизации — еще одна сложная задача, которую приходится решать рекомендательной системе. Ведь подписчикам и не подписчикам доступен разный контент, и они по-разному относятся типам монетизации.

Как формируется стоимость подписки и платных фильмов

Стоимость определяется расчетом маржи — видеосервисы тратят большие бюджеты на контент. Расчёты проводят сразу несколько структур внутри компании, которые занимаются развитием бизнеса и платной модели, оценивают цены на фильмы, работают с партнерами и улучшают подписку для пользователей.

Например, за их авторством скидки на платные фильмы для подписчиков, есть бесплатный фильм по пятницам и другие механики, привлекающие пользователей.

Сейчас стоимость ежемесячной подписки ivi — 399 рублей, похожих сумм придерживаются и многие другие участники рынка.

Правообладатели не делают скидок на то, что мы российский сервис и что ещё совсем недавно контент в стране не покупали.

Мы долго работали над снижением стоимости, но понимаем, что в текущих реалиях это невозможно, так как контент становится всё дороже из-за количества игроков, которые стараются перебить цену. Стараемся не увеличивать — цена не изменяется уже несколько лет, это наша победа. Мы договариваемся на таких условиях, чтобы можно было удерживать цену и не поднимать её.

Алексей Казаков

, директор по маркетингу ivi

Как онлайн-кинотеатр зарабатывает на рекламе, чтобы привлекать новых зрителей

Нельзя заставлять пользователя купить фильм или оформить подписку, так как это сильно сузит аудиторию. Работа над контентом по рекламной модели отличается от подписочной, поэтому ей занимается несколько департаментов.

Основной отдел — отдел рекламного бизнеса, который развивает направление рекламной монетизации, также есть аналитики, бэк-офис и отдел продаж. Их основная и общая задача — предложить интересные фильмы и хорошие условия тем зрителям, кто не готов платить за подписку, но хочет пользоваться легальным сервисом.

Но просто предлагать просмотр рекламных роликов скучно — они неинтересны как пользователям, так и рекламодателям. Поэтому команды рекламной модели постоянно запускают новые форматы, например, для аудитории Smart TV это веб-сериалы и интерактивная реклама. Они дают хорошую конверсию и конвертируются в новых зрителей: после просмотра ролика можно сразу записаться на тест-драйв без переходов на сайт.

Страница загрузилась, видео начало играть

Качество фильма зависит от двух частей: скорости и стабильности интернет-соединения пользователя и серверов ivi. Со стороны ivi, за качество, скорость и надёжность соединения отвечает команда ИТ-инженеров. Их задача — чтобы сервер определил, какой фильм хочет посмотреть пользователь, в каком разрешении доступен фильм, есть ли у пользователя подписка, и в зависимости от этого подобрать оптимальные варианты просмотра.

Например, чтобы справляться с высокими нагрузками и запросами к серверам, у ivi есть собственный CDN — сеть доставки контента, которая «понимает», где находится пользователь, и передает ему видеопоток с максимально близкого сервера.

Все серверы распределены по России, чтобы обеспечить доставку контента без задержек для всех зрителей.

Также инженеры ivi работают над внутренней стороной приложений — они должны определять, какие кодеки и форматы поддерживает устройство, быстро подгружать фильм и компенсировать потери соединения в моменты, когда у зрителя нет интернета.

Одна из технологий, которую используют разработчики — адаптивный стриминг видео. Она позволяет в момент нестабильного соединения получить немного худшую картинку из-за снижения битрейта видео, но при этом пользователь продолжает просмотр без задержек.

Что нужно, чтобы рекомендации работали ещё лучше

Исследования в области рекомендаций и пользовательского поведения говорят о том, что недостаточно показать пользователю фильм, о котором он слышит в первый раз, чтобы он доверился системе и посмотрел его. Нужно объяснять пользователю, почему этот фильм ему подходит и почему его стоит посмотреть.

Сейчас модели обучения основаны на глобальном «смотрении» всего контента, но даже если человек хорошо разбирается в голливудском кино, он вряд ли будет так же хорошо разбираться в болливудском. На данный момент алгоритмы просто понимают, что есть множество контента и определенные паттерны его просмотра, но этого уже недостаточно.

Актуальная задача разработчиков рекомендательной системы ivi — научить систему разделять смотрение разных типов контента, чтобы модель знала про каждый и могла лучше его рекомендовать.

Фактически, аналитики и разработчики должны «научить алгоритмы смотреть фильм изнутри»: понимать семантику фильма, разбираться в том, о чем он, кто его снял, какой у него жанр и так далее.

Для этого нужно много метаинформации о фильме: его жанр, кто снимал и снимался в нём, анализировать видеоряд фильма, тексты и описания. Например, для идентификации жанра можно анализировать цветовую гамму фильтра: комедии более красочные, а драмы снимаются в приглушённых или тёмных тонах.

Также, для определения жанровой и тематической составляющей фильмы можно учитывать длительность планов — непрерывных последовательностей кадров от одной монтажной склейки до другой. В боевиках таких планов очень много, и они очень короткие. В тоже время в более интеллектуальном кино один план может длиться минуту.

Актеры и другие участники съемок тоже влияют на ощущения зрителей, причем не всегда явным образом. Например, людям часто нравятся фильмы, в которых один и тот же сценарист, хотя обычно при выборе фильма смотрят на режиссера или актеров. Все эти мелкие детали дают общую информацию о фильме, и ей нужно пользоваться, чтобы сделать рекомендации ещё лучше.

Наконец, сами рекомендации нужно лучше объяснять. Часто видно, что пользователь приходит, видит рекомендации и раздумывает, довериться ли рекомендательной системе или же посмотреть на что-то более известное с точки зрения постера или советов друзей и знакомых. Или же просто выбирает из списка «посмотреть позже».

И это то, к чему стремятся разработчики — создать ощущение веры в проект и в то, что Hydra умеет выбирать контент, который понравится каждому.

Как присоединиться к команде онлайн кинотеатра

Сегодня ivi — это команда, состоящая из 550 профессионалов, ежедневно развивающих наш сервис. Мы активно растем и постоянно находимся в поиске лучших специалистов на рынке, готовых разделить наши цели и поддержать атмосферу драйва, вовлеченности и экспертизы.

Надежда Петрушенко, директор по персоналу онлайн-кинотеатра ivi
0
26 комментариев
Написать комментарий...
Куртуазный маньерист

Эта статья для форумов мамочек. Никакой мякотки.

"Например, они разработали алгоритм, по которому на главной странице ivi нет двух одинаковых фильмов"

Серьёзно? Вы думаете интересно читать подобную лажу?

Ответить
Развернуть ветку
Bulat Kerimov

"Например, они разработали алгоритм, по которому на главной странице ivi нет двух одинаковых фильмов"
If tv_show in vitrina then tv_show.hide()

Ответить
Развернуть ветку
Микхаил Владимирович

Так бы Турал получал как обычный разработчик, а тут он специалист по машинному обучению)

Ответить
Развернуть ветку
Mikhail Pershin

Select distinct... order by... 

Ответить
Развернуть ветку
Олег Романишен

Хммм, Hydra? Коллаборация что ли? 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
mr Lib

И ни слова про потоковое скачивание с помощью торрент-клиента.

Ответить
Развернуть ветку
Annie Way

Мне интересно, сотрудники делают так?

Ответить
Развернуть ветку
Dmitry Ilyin

Оч. интересно! Правда, из статьи децл создаётся ощущение, что собственная рекомендательная система - основа бизнеса. )
И пара вопросов. 

1) А на основании чего принимается решение, будет ли фильм монетизироваться по TVOD - модели или SVOD?

2) Исходя из статьи, создаётся ощущение большого штата высококвалифицированных спецов (разработка, аналитика, реклама, несколько департаментов работы с контентом). А является ли IVI хотя бы операционно прибыльным, или пока нет?

Ответить
Развернуть ветку
Ekaterina Godunova

Дмитрий, рекомендательная система без огромного каталога контента априори не может быть основной бизнеса. Как минимум, для того, чтобы что-то рекомендовать, надо это что-то иметь в большой количестве. 
1) Решение о первичной модели монетизации зависит в первую очередь от условий правообладателя. Здесь же лежат и причины того, почему отдельные фильмы прошлого столетия доступны по EST и т.д. 

2) Да, ivi является операционно прибыльным. Так же, из открытых достоверных источников можно узнать, например, следующее, цитирую: "В декабре 2018 г. почти 1,2 млн человек хотя бы раз заплатили ivi за подписку, за просмотр отдельного фильма или сериала. Это вдвое больше, чем в декабре 2017 г.", "Выручка онлайн-кинотеатра ivi по итогам 2018 года выросла на 62% до 3,9 млрд руб.," и много других фактов, которые дают основу уважать этот бизнес. 

Ответить
Развернуть ветку
Николай Кузнецов

Статью год назад писали? Бесплатные фильмы по пятницам уже отменили. 

Система рекомендаций конечно работает, но я зарёкся оценивать высоко фильмы и особенно мультфильмы. Каждая такая повышенная оценка приводит к тому что система начинает усиленно рекомендовать очень средние фильмы с рейтингами около 6 из того же жанра.  А с мультфильмами вообще беда, один оцененый мульт и пару недель пол рекомендаций одни мультфильмы.  

Так что вообще стараюсь лайкать как можно реже и только тот же рейтинг что и все зрители. 

Ответить
Развернуть ветку
Олег Ивахнов
Что происходит, когда вы решили посмотреть сериал

Важнее, что происходит ДО этого момента.
Дети у бабушки с дедушкой или спят, время не более 22:00 или завтра н куда не надо утром, нет желания встречаться с друзьями или каких то интересных планов или важных дел.
То есть почти никогда ))))

Ответить
Развернуть ветку
Mikhail Pershin

Главное чего нет - какие ставятся цели (не финансовые вроде заработать денег),какой целевой клиентский опыт, чем измеряется. Может и не нужен этот весь ML AI? 

Ответить
Развернуть ветку
Tural Gurbanov

Рассказать про все и сразу не получается :)
Если мы говорим про рексис, то у нас две глобальные цели: повысить конверсию в смотрение и retention. Независимо от типов монетизации, данные две цели положительно влияют на компанию. Помимо глобальных, есть и локальные, а именно повышение конверсии в "полезное" действие с блоков подвластных Гидре. Есть также более специфичные цели и метрики, которые так или иначе влияют на предыдущие. Например, "повысить динамичность рекомендаций" или "сделать так, чтобы пользователь видел контент специфичный для его региона/страны"

Ответить
Развернуть ветку
Денис Пихаров

Я писал длинный пост, но потом вот 

Ответить
Развернуть ветку
Sergei Smalkov

Интересная статья. По сути платформа поставки контента. Внутри несколько продуктов, каждый под свою монетизацию. Интересно, как команды делятся под эти разные продукты? Как разные продукты друг у друга отъедают аудиторию? Как работает привлечение под разные монетизации? И не проще ли всем продать подписку?

Ответить
Развернуть ветку
Tural Gurbanov

Если коротко - все очень сложно :)
У каждого направления (по типу монетизации) свои приоритеты. Поверх приоритетов направлений, накладываются приоритеты компании. На заре ivi, наиболее приоритетным было рекламное направление. Тогда многие пользователи не были готовы покупать подписку и в принципе платить за контент. Сейчас ситуация меняется, поэтому приоритет склоняется в пользу платных направлений. Но, к сожалению, приоритет склонился не так сильно, чтобы предлагать всем только подписку. Кроме того, в России существуют альтернативные и бесплатные/более дешевые способы просмотра контента торренты/ТВ/кабельное ТВ. Это не США где кабельное ТВ стоит дороже подписки Netflix. Поэтому пока не получается продать всем подписку :).

Ответить
Развернуть ветку
Николай Кузнецов

А продать всем подписку можно только на операторском уровне. Кабы весь Иви, Окко Амедиатека были в онлайн-кинотеатрах провайдеров, то и не нужна бы была вся эта промосуета. Я и сейчас официальное приложение Ivi  использую больше дома и для просмотра с субтитрами, а не титрованое    смотрю через сотового оператора в любом месте города благо за трафик не берут. 

Ответить
Развернуть ветку
Tural Gurbanov

ну, так ведь было не всегда. все меняется и все игроки адаптируются под новые реалии. мы, например, партнеримся с tele2 и МТС, чтобы конечному пользователю и нам было комфортнее.

Ответить
Развернуть ветку
Николай Кузнецов

Ну это да, через них и смотрю. 

Только и они чудят.  Теле2 продвигает Wink через промо бонусов лояльности, а МТС собирается видеоконтент само снимать, тогда как видео в мире уже давно больше, чем может посмотреть человек за свою жизнь. 

Ответить
Развернуть ветку
Василий Сумин

настрою ваш смарт тв за 5$ в месяц, на просмотр кино и сериалов а также ТВ)))

Ответить
Развернуть ветку
Sandy Bell

А мне удобно иви. Пробовал другие и как раз нифига не дружелюбный интерфейс сходу не врубаешься.
Самое для меня главное это чтоб система помнила где бросил смотреть и на любом устройстве подхватила, тк редко сразу досматриваю, а фильмов и сериалов могу десяток начать 😑.
Не ясно почему нет "в августе 44го" и других СНГ фильмов.
Почему наглухо русский сериал в середине просмотра исчезает, например "Журов", "чёрные кошки".
Немного странно что фильмы 1948 года за деньги.. А не в подписке..
А для всего остального есть торрент 😎

Ответить
Развернуть ветку
Вадим Клюев

они деньги за просмотры фильмов вроде просили,а  другие сайты бесплатно, только реклама задолбала

Ответить
Развернуть ветку
Николай Кузнецов

Фильмы до 48 года конечно уже бесплатные, а вот разрешение на оцифровку архивной копии пленки из Госфильмофонда - нет. 

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Сериалы и кино

Ладно. Завтракаст посоветовал надо тестить 

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
23 комментария
Раскрывать всегда