Что происходит, когда вы решили посмотреть сериал

Какие люди и технологии стоят за бесконечной лентой фильмов и сериалов и возможностью за секунду начать просмотр.

Что происходит, когда вы решили посмотреть сериал

Вы решили посмотреть сериал и зашли на главную страницу онлайн-кинотеатра. Например, ivi

Вас встретит персонализированная главная страница с «витриной». Её содержимое зависит от того, новый вы пользователь или постоянный посетитель. Например, новичок видит «заглушку» — разнообразный контент, покрывающий наиболее востребованные пользователями жанры и фильмы из каталога сервиса.

Команда машинного обучения во главе с Туралом Гурбановым уделяет особое внимание главной странице и «витрине».

Например, они разработали алгоритм, по которому на главной странице ivi нет двух одинаковых фильмов — все позиции, которые видит пользователь на первом экране без скроллов, занимает разный контент.

Это сделано, чтобы витрина не только демонстрировала разнообразие каталога, но и работала максимально эффективно, так как каждая позиция в ней — на вес золота.

Заглушка-витрина перестраивается каждый день. Также она зависит от того, из какой страны пользователь и с какого устройства он зашёл — ведь в разных странах доступен разный контент, а некоторые форматы видео удобнее смотреть на разных экранах.

Мы стараемся определять, какой контент приоритетнее на конкретных устройствах и поднимаем его выше. То, что смотрят на мобильных устройствах, может не всегда совпадать с тем, что смотрят на Smart TV. Например, на iOS и Android чаще смотрят сериалы, а на телевизорах контент выбирают более целенаправленно — это может быть фильм в компании друзей или семьи, и чаще этот контент платный.

Турал Гурбанов, руководитель отдела машинного обучения ivi

Рекомендации должны постоянно меняться

Чтобы пользователь видел самый подходящий и интересный контент, разработчики ivi создали рекомендательную систему Hydra. Каждый раз, когда пользователь совершает некоторое «полезное действие», система обновляет свое знание об интересах пользователя и в режиме реального времени генерирует для него новые персональные рекомендации.

Полезными действиями являются просмотр, оценка, покупка и добавление фильма в избранное. Помимо полезных действий, система также учитывает impressions — «взгляд пользователя на постер фильма».

Что происходит, когда вы решили посмотреть сериал

Impression позволяет определить фильмы, которые пользователь увидел в рекомендациях, но по какой-то причине проигнорировал (не провзаимодействовал с ними). Если пользователь заходит несколько раз на сервис, видит один и тот же фильм и никак не взаимодействует с ним, то, скорее всего, этот фильм либо пользователю не нравится, либо он его уже посмотрел.

Hydra учитывает этот неявный сигнал для того, чтобы временно понизить приоритет «неактивным» фильмам и дать возможность другим релевантным проектам попасть на витрину.

Также на рекомендации влияют «близкие по вкусам» пользователи — похожим зрителям, чьи кино-интересы совпадают, рекомендуется похожий контент.

Пользователь может в любой момент настроить рекомендации — чаще ставить рейтинги фильмам и удалять из просмотренного то, что ему не понравилось. В будущем команда инженеров планирует добавить возможность точнее настраивать рекомендации, рассказывая системе, какие фильмы он смотрел, и какие ему понравились.

Как работает Hydra и кто её разрабатывает

Рекомендательная система очень похожа на любую другую базовую модель машинного обучения с подготовкой данных, обучением моделей, тестированием, оптимизацией и интеграцией в сервис. В случае ivi, Data Science (DS) инженеры также занимаются разработкой и поддержкой Hydra.

Команда рекомендательной системы занимается разработкой Hydra, «коннекта» с Data Lake (хранилищем данных), продуктом и аналитикой. У нас сейчас 11 человек, админ, который помогает с эксплуатацией сервиса, собственный аналитик (помимо продуктовых аналитиков), который делает более подробный анализ данных с учётом наших потребностей, тестировщики, DS инженеры и конечно разработчики.

Турал Гурбанов,


Команда Big Data собирает в Data Lake огромное количество событий о том, как пользователи взаимодействуют с сервисом. Например, множество событий-сигналов: просмотры, рейтинги, клики, избранное, список «посмотреть позже», покупки, impressions. А от устройства нужно получить информацию об операционной системе, площадке, стране.

На основе этих данных Hydra учитывает интересы пользователя и строит рекомендации. При построении рекомендаций также учитывается, является ли пользователь подписчиком, есть ли у него детский профиль и многое другое.

Нашей команде интересно именно поведение пользователя, как он реагирует на рекомендации, с чем он хочет взаимодействовать, а с чем нет.

Турал Гурбанов

В Data Lake отправляется информация о том, как пользователи относятся к различным типам монетизации. Например, если какие-то пользователи больше заинтересованы в подписочном контенте, но не покупают транзакционный, нужно это учесть и не продвигать платные фильмы, по крайней мере, показывать не так часто. Таким образом повышается удовлетворенность от сервиса, чтобы пользователь не страдал от того, что точно не будет смотреть.

Что происходит, когда вы решили посмотреть сериал

Вы листаете страницу вниз — появляются разные категории и подборки

В ivi работает большая редакция, которая формирует подборки по тематикам, жанрам или событиям. Например, подбирает фильмы-кандидаты на Оскар, победителей Каннского фестиваля, группирует их по жанрам, «свежести» и так далее. Самые популярные подборки — это новинки.

Пользователь видит подборку, если в ней содержатся релевантные фильмы и она удовлетворяет бизнес-правилам. Например, в подборке должно быть не менее 5-6 фильмов. Их точное число зависит от платформы, на которой зритель запустил ivi — ведь на смартфоне можно отобразить меньше контента, и подборка для него может быть короче.

Есть и автоматическая генерация подборок — ведь редактор не может держать в голове информацию о содержимом всех подборок, доступных на сервисе на определенной платформе и в определенный момент времени. Если не учитывать всей этой информации, содержимое подборок может дублироваться, что делает их похожими друг на друга и убивает идею подборки, как уникального тематического кластера контента.

Сейчас ivi идёт к тому, чтобы у каждого пользователя подборки были персональными, то есть на лету группировались из релевантного для него контента.

Кстати, у Netflix нет идей подборок, только фильтры. Если у него рекомендации — это фильтр, который открывает список других подфильтров, то в ivi — полноценная семантическая подборка.

Что происходит, когда вы решили посмотреть сериал

Вы выбрали фильм или сериал и кликнули на него

Откуда взялся этот фильм и почему нельзя всё посмотреть бесплатно

В ivi есть отдел контента, который закупает фильмы и сериалы и договаривается с правообладателями о формате распространения — с рекламой, платно или по подписке. Они учитывают, что все фильмы распределяются по «окнам»: сначала фильм выходит в кинотеатры, через 1-2 месяца правообладатель отдает фильм на платную модель распространения, в «цифровое окно». Так фильм попадает в стриминговые сервисы и цифровые магазины.

Ещё через 1-2 месяца фильм становится доступен по подписке. Через 3-4 месяца фильм может стать бесплатным для зрителей, но с рекламными блоками

Некоторые из правообладателей, как правило, самые крупные компании, не разрешают отдавать свой контент по рекламной модели из-за имиджевых рисков.

Поэтому разделение фильмов по моделям монетизации зависит от правообладателя и их требований. Одна из основных задач отдела контента — постоянно пополнять медиатеку. Новинками, классикой и с возможностью «циркуляции» фильма из платной модели в рекламную.

В целом, фильмы из подписки в рекламный формат переносятся постоянно, чтобы пополнять каталог и привлекать новых зрителей. Часто после подписки команда переводит фильм на рекламную модель, если договоренности с правообладателем позволяют это сделать.

Что происходит, когда вы решили посмотреть сериал

Кстати, офлайн-доступ тоже определяется правообладателем и является одним из «бонусов» для подписчиков. Возможность скачивания фильма — это часть сложного договора с правообладателем, поэтому скачать можно не все фильмы, которые есть в подписке.

Наличие нескольких типов монетизации — еще одна сложная задача, которую приходится решать рекомендательной системе. Ведь подписчикам и не подписчикам доступен разный контент, и они по-разному относятся типам монетизации.

Как формируется стоимость подписки и платных фильмов

Стоимость определяется расчетом маржи — видеосервисы тратят большие бюджеты на контент. Расчёты проводят сразу несколько структур внутри компании, которые занимаются развитием бизнеса и платной модели, оценивают цены на фильмы, работают с партнерами и улучшают подписку для пользователей.

Например, за их авторством скидки на платные фильмы для подписчиков, есть бесплатный фильм по пятницам и другие механики, привлекающие пользователей.

Сейчас стоимость ежемесячной подписки ivi — 399 рублей, похожих сумм придерживаются и многие другие участники рынка.

Правообладатели не делают скидок на то, что мы российский сервис и что ещё совсем недавно контент в стране не покупали.

Мы долго работали над снижением стоимости, но понимаем, что в текущих реалиях это невозможно, так как контент становится всё дороже из-за количества игроков, которые стараются перебить цену. Стараемся не увеличивать — цена не изменяется уже несколько лет, это наша победа. Мы договариваемся на таких условиях, чтобы можно было удерживать цену и не поднимать её.

Алексей Казаков

, директор по маркетингу ivi

Как онлайн-кинотеатр зарабатывает на рекламе, чтобы привлекать новых зрителей

Нельзя заставлять пользователя купить фильм или оформить подписку, так как это сильно сузит аудиторию. Работа над контентом по рекламной модели отличается от подписочной, поэтому ей занимается несколько департаментов.

Основной отдел — отдел рекламного бизнеса, который развивает направление рекламной монетизации, также есть аналитики, бэк-офис и отдел продаж. Их основная и общая задача — предложить интересные фильмы и хорошие условия тем зрителям, кто не готов платить за подписку, но хочет пользоваться легальным сервисом.

Что происходит, когда вы решили посмотреть сериал

Но просто предлагать просмотр рекламных роликов скучно — они неинтересны как пользователям, так и рекламодателям. Поэтому команды рекламной модели постоянно запускают новые форматы, например, для аудитории Smart TV это веб-сериалы и интерактивная реклама. Они дают хорошую конверсию и конвертируются в новых зрителей: после просмотра ролика можно сразу записаться на тест-драйв без переходов на сайт.

Страница загрузилась, видео начало играть

Качество фильма зависит от двух частей: скорости и стабильности интернет-соединения пользователя и серверов ivi. Со стороны ivi, за качество, скорость и надёжность соединения отвечает команда ИТ-инженеров. Их задача — чтобы сервер определил, какой фильм хочет посмотреть пользователь, в каком разрешении доступен фильм, есть ли у пользователя подписка, и в зависимости от этого подобрать оптимальные варианты просмотра.

Например, чтобы справляться с высокими нагрузками и запросами к серверам, у ivi есть собственный CDN — сеть доставки контента, которая «понимает», где находится пользователь, и передает ему видеопоток с максимально близкого сервера.

Все серверы распределены по России, чтобы обеспечить доставку контента без задержек для всех зрителей.

Также инженеры ivi работают над внутренней стороной приложений — они должны определять, какие кодеки и форматы поддерживает устройство, быстро подгружать фильм и компенсировать потери соединения в моменты, когда у зрителя нет интернета.

Одна из технологий, которую используют разработчики — адаптивный стриминг видео. Она позволяет в момент нестабильного соединения получить немного худшую картинку из-за снижения битрейта видео, но при этом пользователь продолжает просмотр без задержек.

Что происходит, когда вы решили посмотреть сериал

Что нужно, чтобы рекомендации работали ещё лучше

Исследования в области рекомендаций и пользовательского поведения говорят о том, что недостаточно показать пользователю фильм, о котором он слышит в первый раз, чтобы он доверился системе и посмотрел его. Нужно объяснять пользователю, почему этот фильм ему подходит и почему его стоит посмотреть.

Сейчас модели обучения основаны на глобальном «смотрении» всего контента, но даже если человек хорошо разбирается в голливудском кино, он вряд ли будет так же хорошо разбираться в болливудском. На данный момент алгоритмы просто понимают, что есть множество контента и определенные паттерны его просмотра, но этого уже недостаточно.

Актуальная задача разработчиков рекомендательной системы ivi — научить систему разделять смотрение разных типов контента, чтобы модель знала про каждый и могла лучше его рекомендовать.

Фактически, аналитики и разработчики должны «научить алгоритмы смотреть фильм изнутри»: понимать семантику фильма, разбираться в том, о чем он, кто его снял, какой у него жанр и так далее.

Для этого нужно много метаинформации о фильме: его жанр, кто снимал и снимался в нём, анализировать видеоряд фильма, тексты и описания. Например, для идентификации жанра можно анализировать цветовую гамму фильтра: комедии более красочные, а драмы снимаются в приглушённых или тёмных тонах.

Также, для определения жанровой и тематической составляющей фильмы можно учитывать длительность планов — непрерывных последовательностей кадров от одной монтажной склейки до другой. В боевиках таких планов очень много, и они очень короткие. В тоже время в более интеллектуальном кино один план может длиться минуту.

Актеры и другие участники съемок тоже влияют на ощущения зрителей, причем не всегда явным образом. Например, людям часто нравятся фильмы, в которых один и тот же сценарист, хотя обычно при выборе фильма смотрят на режиссера или актеров. Все эти мелкие детали дают общую информацию о фильме, и ей нужно пользоваться, чтобы сделать рекомендации ещё лучше.

Наконец, сами рекомендации нужно лучше объяснять. Часто видно, что пользователь приходит, видит рекомендации и раздумывает, довериться ли рекомендательной системе или же посмотреть на что-то более известное с точки зрения постера или советов друзей и знакомых. Или же просто выбирает из списка «посмотреть позже».

И это то, к чему стремятся разработчики — создать ощущение веры в проект и в то, что Hydra умеет выбирать контент, который понравится каждому.

Что происходит, когда вы решили посмотреть сериал

Как присоединиться к команде онлайн кинотеатра

Сегодня ivi — это команда, состоящая из 550 профессионалов, ежедневно развивающих наш сервис. Мы активно растем и постоянно находимся в поиске лучших специалистов на рынке, готовых разделить наши цели и поддержать атмосферу драйва, вовлеченности и экспертизы.

Надежда Петрушенко, директор по персоналу онлайн-кинотеатра ivi
1313
26 комментариев

Эта статья для форумов мамочек. Никакой мякотки.

"Например, они разработали алгоритм, по которому на главной странице ivi нет двух одинаковых фильмов"

Серьёзно? Вы думаете интересно читать подобную лажу?

20
Ответить

"Например, они разработали алгоритм, по которому на главной странице ivi нет двух одинаковых фильмов"
If tv_show in vitrina then tv_show.hide()

13
Ответить

Так бы Турал получал как обычный разработчик, а тут он специалист по машинному обучению)

6
Ответить

Select distinct... order by... 

1
Ответить

Хммм, Hydra? Коллаборация что ли? 

8
Ответить

Комментарий недоступен

6
Ответить

Комментарий недоступен

1
Ответить