{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Dmitry Melkov

27 мар 2019 27.03.2019

Между результативностью и хайпом: как MEGOGO внедряет инновации

Как CIO провайдера кино и телевидения MEGOGO рассказываю, как компания использует новые технологии при разработке продукта.

Есть мнение, что новые технологии помогают не всякому бизнесу. Ресурсы, затраченные на внедрение инновации, могут не окупиться. Она не принесет компании весомые преимущества перед конкурентами.

Мы как продуктовая IT-компания с собственными технологическими разработками придерживаемся другой точки зрения. MEGOGO на рынке более 7 лет, но мы считаем, что продукты нужно совершенствовать постоянно, какой бы зрелой компания ни была. Рынок постоянно изменяется, технологии развиваются, поэтому бизнес должен сохранять дух стартапа.

В продуктовом департаменте работают 3 R&D-команды, одна из которых занимается big data и machine learning. На примере этой команды мы расскажем, как тестируются и внедряются новые технологии.

Как работает R&D-команда

Подразделение появилось два года назад. К тому моменту у нас уже были наработки в области рекомендательных систем, которыми занимался один человек. Мы решили, что направление перспективное и уже давно де-факто является неотъемлемой частью таких OTT-гигантов, как Netflix и HBO Now.

Сейчас мы выросли до 6 человек. Три DS/ML-инженера решают различные задачи в плоскости content discovery, а также smart solutions и BI. Два data-инженера собирают чистые данные и занимаются data-пайплайнами — наборами элементов последовательной обработки данных. Не так давно в команде появились аналитик (у нашего бизнеса появилось много «хотелок») и DevOps (решения, поставляемые командой, требуют серьезного инфраструктурного setup’a).

Основной язык программирования в команде — Python, немного используем Scala и даже Lua. Для обработки больших объемов данных применяем Spark, для оркестрации job — Airflow, основные базы данных — MongoDB и Aerospike. Не брезгуем и AWS: EC2, S3 и Kinesis нам не чужды.

Для нас machine learning — это расширение возможностей работы с данными и реализация новых продуктов и дополнительных элементов для уже существующих.

Как устроены системы рекомендаций контента

История R&D-департамента началась с создания системы неперсонализированных рекомендаций. Рекомендация на странице фильма «что еще посмотреть» раньше содержала одни и те же фильмы, отобранные редакцией. Выбор фильмов был субъективным, они не менялись в зависимости от пользователя, и в какой-то момент список перестал регулярно обновляться. Система была неэффективной, но при этом тратила ресурсы контент-команды.

Мы поняли, что можем внедрить базовые модели, которые принесли бы ценность и сделали подборку релевантной для пользователя. При создании неперсонализированных рекомендаций мы использовали метаданные видеообъекта (до 10 параметров): тип, жанр, страна производства, имена членов съемочной группы. Работали над базой данных самостоятельно, не прибегая к консалтинговым услугам и готовым сервисам.

Внедрив алгоритм, мы обнаружили проблемы в его работе — среди рекомендованных были только сиквелы и приквелы фильма или же просто другие его версии. Для решения мы ввели дополнительную фильтрацию и стали проверять фильмы на высокий коэффициент подобия, а также отсекать фильмы в непривычной для конкретных пользователей озвучке (например, тем, кто смотрит кино на языке оригинала, мы не предлагаем переведенный контент).

Также мы построили персонализированный рекомендательный сервис на основе лайков пользователей, применив простую коллаборативную фильтрацию. Для увеличения охвата зрителей, которым предлагаются рекомендации, мы использовали дополнительный источник информации — внутреннюю систему трекинга фактических просмотров.

При подборе рекомендаций мы также учитываем предпочтения других пользователей. Если говорить упрощенно, это выглядит так: одному зрителю нравятся фильмы A и B, а другому — B и C, значит, первому мы можем предложить посмотреть картину C, а второму — А.

Сейчас системой рекомендации контента пользуется 80% пользователей MEGOGO. Мы ее постоянно совершенствуем — занимаемся content discovery. ML-алгоритмы и искусственный интеллект меняют эту сферу.

Об использовании computer vision

Мы решились на эксперимент — полгода работали над системой с использованием компьютерного зрения. Она была способна анализировать, что происходит в кадре — выявлять предметы, распознавать эмоции и актеров, и подставлять релевантную нативную рекламу. Например, мы сотрудничаем с автопроизводителем, и специальная реклама появляется в кадре в тот момент, когда там проезжает машина.

К такой системе рынок СНГ еще не готов, к тому же, релевантного рекламного контента недостаточно — фильмов, где фигурируют мобильные телефоны или автомобили, мало, и все они из 2000-х, там не будет интересных тегов. Кроме того, такой контент не смотрят органически — мы можем приложить много усилий для реализации коммерческих тегов, но окажется, что просмотров и переходов мало. Есть еще одна проблема: некоторые теги сложно отловить — например, под тег «простуда» может подойти многое.

По этим причинам мы приостановили работу над проектом, но не исключаем, что ситуация может измениться в будущем с развитием технологии.

Какие проблемы команда решает сейчас

Когда пользователь приходит на платформу, он обычно не знает, что смотреть. Мы работаем над smart-системой, которая позволит показать интересный фильм. По данным PwC, около 90% пользователей остаются довольными предложенным видеосервисами контентом, но при этом 73% респондентов уверены, что друзья и близкие лучше знают их предпочтения. Наша задача — удержать зрителя, повысить его лояльность.

Максимально персонализированные рекомендации, учитывающие пользовательский опыт в пределах платформы (включая поведенческие паттерны) — это цель R&D-команды MEGOGO.

2 показа

953 открытия

3 комментария

Стас Крутовский

27.03.2019

Реально инновационного в статье только использование computer vision, да и то оказалось, что внедрять отказались, ну такое, хвастать особо нечем :)

Ответить

Развернуть ветку

Dmitry Melkov

28.03.2019 Автор

Мы временно отказались — оценив соотношение необходимых ресурсов и потенциальной прибыли. Считаем, что рынок пока не готов. Технология действительно интересная, вызовов много, хотелось бы над ними поработать, но есть более перспективные направления с точки зрения бизнеса. И в них, кстати, тоже море челленджей, которые сейчас и пытаемся решить.

Ответить

Развернуть ветку

Смарт Вэй

27.03.2019

До сих пор нет поиска по рейтингу кинопоиска, нет архива каналов у 99 % каналов. У иви есть поиск по кинопоиску и они сразу подняли хд аренду в два раза по сранению с другими сервисами. Вот такие инновации.

Ответить

Развернуть ветку

Написать комментарий...

0 комментариев

Раскрывать всегда