Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

Весной 2021 года Netflix запустил функцию «Play Something», которая помогает пользователю выбрать контент для просмотра с помощью нейросети. Это очередная веха на пути сервиса к максимальной персонализации.

Команда Epic Growth перевела статью Гибсона Биддла, экс вице-президента по продукту в Netflix, об истории роста Netflix в области персонализации с момента запуска стартапа в 1998 году до сегодняшнего дня.

Netflix с первого дня развивал стратегию персонализации благодаря постоянным экспериментам и собственной системе А/В тестирования.

20 лет назад пользователи смотрели лишь 2% фильмов, которые предлагала система. Сейчас эта цифра выросла до 80%. Раньше пользователю приходилось изучать сотни вариантов, чтобы найти то, что нравится. Сегодня большинство пользователей рассматривают до сорока вариантов, прежде чем нажать на кнопку «Просмотр». Netflix надеется, что через двадцать лет будет предлагать тот самый вариант, который сразу понравится.

1998: Стартап «DVD по почте»

В 1996 году Netflix вышел в свет как стартап, рассылающий DVD по почте. На первой версии сайта Netflix в 1998 году было менее 1000 DVD-дисков.

Вот как сайт выглядел первые несколько лет. Здесь и далее источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fmarker.medium.com%2Fa-brief-history-of-netflix-personalization-1f2debf010a1&postId=262651" rel="nofollow noreferrer noopener" target="_blank">оригинал</a> статьи
Вот как сайт выглядел первые несколько лет. Здесь и далее источник: оригинал статьи

В 1999 году фильмотека выросла до 2600 DVD, но сервис стремился к расширению до 100 000. Чтобы пользователям было проще искать фильмы, Netflix разработал персонализированную систему мерчандайзинга.

В 2000 году Netflix перешел к варианту подписки на все фильмы сразу. Сервис добавил «очередь просмотра» — список отложенных фильмов. Когда пользователь возвращал DVD, Netflix отправлял следующий по списку диск прямо в почтовый ящик.

2000: Cinematch

Netflix создал персонализированную систему рекомендаций на основе рейтингов, чтобы предсказывать заинтересованность пользователя в фильме. Этот алгоритм коллаборативной фильтрации назывался Cinematch.

Вот простой способ понять коллаборативную фильтрацию:

Представьте, что и мне, и вам нравятся два фильма: «Бэтмен: Начало» и «Во все тяжкие». Мне нравится казино, и алгоритм подсказывает, что и вам оно может понравиться. Теперь примените этот подход к миллионам пользователей и названий.

2001: Пятизвездочная система оценки

Netflix создал пятизвездочную систему оценки и собрал миллиарды ответов. Компания экспериментировала с несколькими рейтингами, иногда суммируя их, чтобы указать ожидаемый рейтинг, средний рейтинг и рейтинг друзей. Рейтинги помогали другим людям оценить, стоит ли смотреть фильм.

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

2002: Несколько алгоритмов

Кроме Cinematch, еще три алгоритма помогали продавать фильмы:

Динамическое хранилище: этот алгоритм указывал, был ли DVD доступен для просмотра. В конце эпохи DVD алгоритм даже определял, был ли диск доступен в локальном хабе пользователя. К 2008 году Netflix продавал только доступные поблизости диски, чтобы повысить вероятность доставки на следующий день.

Metasims: этот алгоритм показывал всю информацию о фильме — синопсис сюжета, режиссера, актеров, год, награды, язык и т. д.

Поиск по сайту. Сначала команда предполагала, что пользователи ищут только дорогие диски с премьерами, и не стремилась развивать эту функцию. Однако исследование показало, что люди часто ищут старые и недорогие фильмы, поэтому компания решила увеличить вложения в разработку удобного поиска.

2004: Профили пользователей

Узнав, что несколько членов семьи использовали одну учетную запись, Netflix запустил «Профили». Эта функция позволила каждому создавать собственный список фильмов внутри одного аккаунта. Только 2% пользователей пользовались этой функцией, несмотря на агрессивное продвижение. Потратить время на составление упорядоченного списка DVD-дисков был готов только один человек в каждом доме.

Но когда Netflix решил убрать функцию, это вызвало много негатива. Часть пользователей уже оценили ее и даже боялись, что отмена профилей разрушит их брак. Профили оставили и в конце концов функцией начала пользоваться половина клиентов.

2004: Раздел «Друзья»

Гипотеза: если создать сеть друзей в Netflix, они будут предлагать друг другу идеи для фильмов и не откажутся от сервиса, чтобы не расставаться с друзьями. Сразу после запуска 2% пользователей связались хотя бы с одним другом, но этот показатель никогда не превышал 5%.

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

Netflix убрал эту функцию в 2010 году в рамках программы «расхламления» — удаления функций, которые пользователи не оценили.

Но так Netflix получил два ценных инсайта о социальных связях в контексте фильмов:

1. У друзей может быть плохой вкус.

2. Люди не хотят, чтобы друзья знали все фильмы, которые они смотрят.

Впоследствии Facebook успешно применил их ко многим своим продуктам.

2006: Стратегия персонализации Netflix

Персонализация Netfix в 2006 году была организована в формате стратегии / метрики / тактики.

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

Идея была такова: собрать все очевидные и неочевидные данные, а затем использовать различные алгоритмы и тактики, чтобы связать пользователей с фильмами, которые им нравятся. Команда сосредоточилась на четырех основных стратегиях:

  • Сбор подробных данных о предпочтениях, включая рейтинги фильмов и телешоу, рейтинги жанров и демографические данные.
  • Изучение неочевидных данных о предпочтениях: например, DVD, добавленные в очередь просмотра, или то, какие фильмы пользователи стримили (после запуска стримингового сервиса).
  • Создание алгоритмов помощи на этапе выбора. Netflix также собирался создать простой интерфейс, который визуально поможет выбрать нужный контент.
  • Повышение качества контента. Сервис планировал повысить процент удержания пользователей за счет лучшего контент.

У сервиса была гипотеза высокого уровня: персонализация поможет пользователям находить более подходящие и интересные фильмы, что в итоге улучшит ретеншн.

Однако, чтобы повлиять на этот показатель, нужны годы. Поэтому Netflix создал краткосрочную прокси-метрику: команда измеряла процент пользователей, оценивших >50 фильмов в первые 2 месяца после регистрации. Теория заключалась в том, что пользователи будут оценивать больше фильмов, чтобы получить более точные рекомендации. Прокси-метрика росла, а значит, пользователям персонализация понравилась — гипотеза подтвердилась.

Приблизительный рост прокси-метрики по годам
Приблизительный рост прокси-метрики по годам

2006: Рейтинг-мастер

Изначально персонализация представляла собой раздел на сайте с вкладкой «Рекомендации». Но тестирование показало, что пользователям не нравится такой предписывающий тон. Вкладку переименовали на «Фильмы, которые вы полюбите», и она вызвала большой отклик. Команда разработки считала вкладку «некрасивой», но она сработала.

Когда пользователи привыкли к разделу «Фильмы, которые вы полюбите», сайт познакомил их с «Рейтинг-мастером»:

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

Рейтинг-мастер помог вырастить прокси-метрику «процента пользователей, оценивших >50 фильмов за первые два месяца» и стал основным источником данных о предпочтениях.

2006: Демографические данные

Прокси-метрикой для алгоритмов персонализации было RMSE (среднеквадратическое отклонение) — разница между прогнозируемой и фактической оценкой пользователем фильма. Например, идеальным прогнозом было сбывшееся предсказание, что вы оцените «Друзья» и «Сайнфельд» в четыре и пять звезд соответственно.

Показатель RMSE со временем вырос благодаря улучшениям в алгоритме коллаборативной фильтрации.

Однако данные о возрасте и поле никак не улучшали RMSE, потому что выбор фильма зависит от совсем других факторов. Стало ясно, что гораздо полезнее знать несколько фильмов или телешоу, которые нравятся человеку.

Как это работает сейчас: создайте новый профиль в своей учетной записи Netflix и укажите несколько фильмов, которые вам нравятся. Готово! Алгоритм персонализации запущен.

2006: Коллаборативная фильтрация в QUACL

QUACL — это алгоритм для очереди просмотра. Как только пользователь добавляет фильм в список, появляется поп-ап, предлагающий похожие варианты.

За несколько лет QUACL увеличил количество добавленных в очередь просмотра фильмов с 10% до 20%. Фактически, Netflix провел часть своих первых тестов машинного обучения в рамках QUACL.

2006: 1 миллион долларов от Netflix

Как у любого стартапа, ресурсы Netflix были ограничены. Ценность Cinematch была доказана, но лишь пара разработчиков могли сосредоточиться на алгоритме. Было принято решение отдать разработку алгоритма на аутсорс с помощью конкурса Netflix Prize.

Netflix предложил награду в 1 миллион долларов любой команде, которая улучшит RMSE для алгоритма Cinematch на 10%. Команда персонализации предоставила анонимные данные от пользователей Netflix в качестве обучающих данных, а также второй набор данных с реальными рейтингами пользователей, чтобы команды могли проверить предсказательную силу своих алгоритмов.

По итогам конкурса было сделано два вывода:

  • Не все рейтинги фильмов равны. Конкурсанты обнаружили, что рейтинги новых фильмов имеют большую предсказательную силу, чем старые.
  • Чем больше алгоритмов, тем лучше. В конце каждого года Netflix выплачивал ведущей команде вознаграждение в размере 50 000 долларов. В последний день года команды, занявшие второе и третье места, объединили свои алгоритмы и поднялись на вершину таблицы лидеров, чтобы выиграть ежегодный приз за прогресс. Так команды узнали о важности комбинирования множества алгоритмов.

Спустя 2 года команда «BellKor’s Pragmatic Chaos» выиграла конкурс, обойдя 5000 других команд. Они увеличили RMSE на 10,06% и выиграли миллион долларов.

Итоговая таблица лидеров
Итоговая таблица лидеров

Но после запуска алгоритма в крупномасштабном A/B-тестировании измеримой разницы в ретеншне не было. Результат был неутешительный.

Возникла новая гипотеза. Чтобы улучшить ретеншн, потребовались более совершенные алгоритмы, которые объяснят выбор контента для каждого пользователя.

Улучшенные алгоритмы + UI / поддержка дизайна / контекст = рост удержания

Стоило ли проведение конкурса миллиона долларов? Абсолютно. Раньше разработчики считали сервис очередным екомерсом, а после конкурса Netflix получил статус инновационной компании.

2007: Запуск стрим-канала Netflix

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

После запуска стримингового канала в 2007 году у команды Netflix впервые появились данные в режиме реального времени о том, какие фильмы смотрят пользователи (раньше у них была информация только по аренде DVD). Эти данные стали более важными для прогнозирования вкусов пользователей, чем те, что Netflix собрал с помощью пятизвездочной рейтинговой системы.

2011: Проект Netflix «Геном кино»

Netflix начал разрабатывать собственный проект «Геном кино», наняв 30 «фильмологов», чтобы они размечали различные атрибуты фильмов и телешоу.

Алгоритм коллаборативной фильтрации Netflix предсказывает, что вам понравится фильм, но не может объяснить, почему. А вот алгоритм Cinematch приводит утверждениям вроде: Поскольку вам нравится «Бэтмен: Начало» и «Во все тяжкие», мы думаем, вам понравится «Улица Сезам».

Новый алгоритм генома фильма называется «Категория интереса». Теперь Netflix предлагает фильм и объясняет, почему он может понравиться пользователю.

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

С появлением этого алгоритма вырос процент пользователей, которые смотрели нетфликс не менее 40 часов в месяц.

2011: Как работают алгоритмы персонализации

Как формируется принудительный ранжирующий список фильмов для каждого пользователя:

Контент, который скорее всего понравится --> контент, который понравится с меньшей вероятностью.

Затем этот список фильтруется, нарезается на кусочки и кубики в соответствии с атрибутами фильмов, телешоу и вкусами пользователей.

Пример разделения на тематические подсписки: «драмы с сильными героинями-женщинами» и «остроумные, дерзкие телешоу». Также это может звучать как «Вы смотрели «Очень странные дела» , поэтому вам может понравиться…» или «10 лучших фильмов для вас».

Подход Netflix к персонализации состоит из трех компонентов:

  • Список наименований для каждого пользователя с принудительным ранжированием.
  • Понимание наиболее подходящих фильтров для каждого пользователя, чтобы алгоритмы могли отображать подмножество фильмов и телешоу из списка.
  • Способность понимать наиболее релевантные категории для каждого пользователя, в зависимости от платформы, времени суток и большого количества явных / неявных данных о вкусе фильмов.

2011: Netflix доказывает, что персонализация улучшает ретеншн

В 2011 году Netflix продемонстрировал улучшение метрик удержания в большом A/B-тесте. Группе А была предложена рекомендация фильмов, основанная на личных предпочтениях конкретного пользователя, а группе В — случайная подборка фильмов.

Разработчики Netflix жаловались, что тест был пустой тратой времени, ведь всем уже было ясно, персонализация повысила удобство работы с сервисом. Тест ожидаемо доказал, что ретеншн в группе А был намного выше и персонализация 100% влияет на удержание.

2012: Новое изобретение профилей

Функция профилей, которую Netflix ввел в 2004 году была не особо популярна, потому что их создание занимало много времени.

Сейчас профили устроены гораздо проще: вы предоставляете имя, три фильма, которые вам нравятся, и сервис создает индивидуальный опыт для каждого профиля.

Сегодня более половины учетных записей Netflix имеют несколько профилей. Netflix знает вкусы фильмов для 200 миллионов аккаунтов, что означает понимание вкусов фильмов 500 миллионов зрителей.

2013: Персонализация как ключ к созданию оригинальных сериалов

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

Зная, что миллионам пользователей понравился Кевин Спейси и «The West Wing», Netflix запустил сериал «Карточный домик». За шесть сезонов в него вложили более 500 миллионов долларов.

К этому моменту уже ясно, что персонализация доставляет удовольствие покупателям своей уникальностью и в то же время повышает чек. За счет упрощения поиска фильмов Netflix растит ретеншн и увеличивает LTV.

Но есть еще один аспект персонализации, который улучшает маржу компании: способность Netflix «правильно рассчитывать» свои расходы на контент. Вот примеры правильных инвестиций Netflix:

  • Netflix прогнозирует, что 100 миллионов пользователей будут смотреть «Очень странные дела», и инвестирует в сериал 500 миллионов долларов.
  • Команда специалистов по анализу данных предсказала, что забавный мультфильм для взрослых «Конь Боджек» будет смотреть 20 миллионов человек, поэтому Netflix инвестирует 100 миллионов долларов в этот мультсериал.
  • Основываясь на прогнозе, что 1 миллион человек будет смотреть документальные фильмы о восхождении на Эверест, Netflix инвестирует 5 миллионов долларов в этот жанр.

Огромное преимущество Netflix — способность определять размер первоначальных вложений в контент и прогнозировать, сколько людей будет смотреть конкретный фильм. При этом Netflix не применяет подходы, основанные на данных, к процессу создания фильмов — они не вмешиваются в творческий процесс.

В 2013 году Netflix получил премию «Эмми» за «Персонализированные механизмы рекомендаций для поиска видео».

2015: Есть ли разница, если ты француз?

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

С 2015 по 2021 год Netflix расширился с 20 до 40 языков, запустив сервис в 190 странах. Команда персонализации задумалась, следует ли сообщать алгоритмам персонализации родной язык и страну каждого пользователя. Краткий ответ, основанный на результатах A / B-тестирования: «Нет».

Как и данные о возрасте и поле, язык и география никак не помогают улучшить предсказания фильмов для зрителей. Самый эффективный способ сформировать профиль вкуса пользователя — узнать несколько телепередач или фильмов, которые им нравятся. Netflix стал передавать алгоритмам названия, которые пользователи оценивают, смотрят, прекращают смотреть или просто интересуются, кликнув на «Смотреть фильм» или просмотрев трейлер.

2016: Тестирование персонализированного интерфейса

Три культурных принципа Netflix — любопытство, искренность и смелость. Сервис призывает новых сотрудников разрушать шаблоны и ценит «свежий взгляд» на вещи.

Новый руководитель продукта в Netflix предложил команде протестировать «плавающие строки». Идея заключалась в том, что такие строки, как «10 лучших для Гиба», «Свежие релизы» и «Продолжить просмотр» должны быть разными для каждого пользователя и даже меняться в зависимости от устройства, времени суток и других факторов.

Считается, что непоследовательный дизайн сайта может смутить и раздражать клиентов, поэтому лучше сохранить согласованный интерфейс. Но гипотезу было решено протестировать.

Удивительно, но непоследовательный интерфейс показал лучшие результаты в A/B-тестах. Сегодня даже пользовательский интерфейс персонализирован в зависимости от вкусовых предпочтений пользователей.

2017: Переход от звезд к лайкам

В 2017 году Facebook представил новую рейтинговую систему: лайк или дизлайк. Netflix решил провести сравнительный тест пятизвездочной системы и системы «лайков» и получил очевидный результат: более простая система лайков собрала вдвое больше отклика. Кликать пальцем вверх или вниз намного проще.

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

2017: Что же произошло с пятизвездочной системой?

Как оценить качество фильма без 5 звездочного рейтинга? Одна из первых гипотез Netflix заключалась в том, что со временем средние рейтинги просматриваемых фильмов будут расти, что приведет к повышению ретеншна. Рейтинги действительно выросла, но ничего не указывало на их связь с ретеншном.

Оказалось, высокий рейтинг не равен удовольствию от просмотра. Вы можете оценить фильм на 5 звезд, но это не значит, что он нравится больше, чем фильм на 3 звезды. Иногда зрителю нужна просто легкомысленная комедия. По этой причине одной из первых крупных инвестиций Netflix стали четыре картины с комиком Адамом Сэндлером.

2017: Процентное совпадение

Netflix переключился на «процентное совпадение», которое показывало, насколько вам понравится фильм, независимо от его качества.

Netflix показывает 80% совпадение для фильма «Ирландец». С вероятностью 80% он понравится пользователю.
Netflix показывает 80% совпадение для фильма «Ирландец». С вероятностью 80% он понравится пользователю.

2018: Персонализированное искусство

Netflix начал использовать персонализированные визуальные эффекты.

Цитата из технического блога Netflix:

Рассмотрим заставку фильма «Умница Уилл Хантинг». Тому, кто смотрел много мелодрам, мы покажем иллюстрацию с Мэттом Дэймоном и Минни Драйвер, а для любителя комедий используем иллюстрацию комика Робина Уильямса.

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

Netflix использует знания о предпочтениях, не только чтобы подобрать фильм, но и принимает во внимание вкусы пользователей, чтобы поддержать этот выбор с помощью персонализированных визуальных эффектов.

2021: Вам везет?

Максимальная персонализация — вы включаете телевизор, и Netflix волшебным образом воспроизводит фильм, который вам понравится. Первый эксперимент Netflix с этой концепцией — это функция, которую co-CEO компании Рид Гастингс в шутку назвал кнопкой «Мне повезет».

Как Netflix стал мировым лидером в персонализации. Краткая история киллер-фичи и прогноз на 2040 год

Когда вы заходите в свой профиль, появляется новая кнопка «Посмотреть что-нибудь». Думайте об этой кнопке как о показателе того, насколько хорошо алгоритмы Netflix соединяют пользователей с фильмами, которые им понравятся. По предположению Гиба, 2–3% воспроизведения сегодня происходят именно с этой кнопки.

Вот долгосрочное видение персонализации: через двадцать лет Netflix уберет как эту кнопку, так и свою персонализированную систему мерчендайзинга, и тот особый фильм, который вы хотите посмотреть в данный момент, автоматически начнет воспроизводиться. Анализируя путь Netflix, они могут достигнуть этого в ближайшие 20 лет.

Заключение

Более 80% телешоу и фильмов пользователи Netflix смотрят с помощью алгоритмов персонализации. Это позволило создать технологическое преимущество, которое невозможно скопировать, что радует клиентов и увеличивает прибыль.

История Netflix учит начинающие проекты тому, что нужно иметь:

  • План: стратегия продукта с соответствующими показателями и тактиками.
  • Метод быстрой проверки различных гипотез.
  • Культуру, которая поощряет рискованность, любопытство, откровенность, а также смелость сказать: «Давайте протестируем эту идею».

Последнее требование: терпение. Чтобы создать продукт и компанию мирового класса, нужны десятилетия.

Понравилась статья? Подписывайтесь на телеграм-канал Epic Growth — рост продуктов. 150+ кейсов про процессы, эксперименты, личную эффективность и все, что помогает развивать продукты.

4848
14 комментариев

Вот долгосрочное видение персонализации: через двадцать лет Netflix уберет как эту кнопку, так и свою персонализированную систему мерчендайзинга, и тот особый фильм, который вы хотите посмотреть в данный момент, автоматически начнет воспроизводиться. Анализируя путь Netflix, они могут достигнуть этого в ближайшие 20 лет.

12

 Как Netflix стал мировым лидером в персонализации

По собственным заявлениям. 

8

КиноПоиск HD помогает мне найти хороший фильм. Причем часто на главной странице при воде в приложение у меня появляется годнота. По описанию и актерскому составу принимаю решение, стоит фильм или нет просмотра. КиноПоиск начал мне рекомендовать корейские фильмы. Они же просто бомба! Такие философские подтексты западу не снились. Запад боится так заворачивать и может разве что Нолан на такие эксперименты пойти. Все остальное артхаус, которого не касаюсь. Корейские фильмы это золото для меня, который подобрал мне однажды КиноПоиск. Никакая не реклама. Факт из жизни и взаимодействия с алгоритмами и технологиями, которые сделали эту жизнь веселее.

Есть большой минус, что много лишней инфы: подборки от бабы сраки какой-то, какие фильмы смотрит Тарантино, что любят россияне или другие пользователи КиноПоиск - вот это мне не надо. Хочу персонализацию, в крайнем случае от друзей рекомендации. Мне чужие вкусы в кино не пристало, ибо обсуждать я это на кинопоиске не буду.

Дизайн КиноПоиска тоже так себе. Хочу чтоб было максимум три фильма на моем экране. Телевизор больше метра диагональ, там поместятся скриншоты или гифки даже. Вот два-три фильма мне на экран выводите с самыми классными сценами или сразу трейлер без звука запускайте, только середину трейлера, где главный смак. Я сразу пойму, врубать мне кино или нет. Кому я это пишу?

4

А мне не нравится программа Кинопоиска. Первые неск месяцев смотрела там только психологические триллеры или детективы, но он постоянно рекомендовал мне «дневник бриджит Джонс», «леди и бродяга» и пачками российские сериалы ... последние, к слову, совсем не переношу, так с чего их алгоритм взял, что они мне нравятся?
Подборки «от бабы сраки» тоже отдельная тема. Список этих подборок иногда странный и не совсем может соответствовать ее названию.

И по поводу автоматического проигрывания трейлеров - я,как и многие мои друзья, не любим смотреть трейлеры. Часто по ним можно понять весь сюжет и смотреть уже не хочется. Так что, если начнут это практиковать - потеряют не плохую часть пользователей.

Они может и используют алгоритмы, стараются, но сравнивать с нетфликс нельзя. Кинопоиск напоминает сырой нетфликс.

Но я им пользуюсь, поскольку за 200₽ ты подписываешься и на скидки в такси, и на музыку, и на фильмы. Плюс ещё много разных плюшек.
У нетфликс за ~1000 ты подписываешься на хороший алгоритм подборки... (про уникальный контент упоминать не стану)

1

История Netflix учит начинающие проекты тому, что нужно иметь:
Деньги. 

3

Комментарий недоступен

Интересно было бы сравнить их алгоритмы с предложением похожего видео в YouTube.

2