Как персонализированные рекомендации в EdTech повышают вовлеченность и выручку

Есть вопросы, которые волнуют человечество веками: «Есть ли высший разум?», «В чем смысл жизни?», «Как выполнить KPI по выручке?». И если на первые два ответа все еще нет, то на третий, возможно, появился интересный экспериментальный результат.

Я наткнулась на исследование, посвященное влиянию персонализированных рекомендаций на вовлеченность пользователей в образовательные приложения. И оказалось, что рекомендации, основанные на интересах пользователей, действительно работают. Причем работают не только на тех, кто уже мотивирован учиться, но даже на новых пользователей. На первый взгляд, эта мысль кажется очевидной — почти как инструкция «не забудьте дышать». Но если присмотреться, можно найти в ней кое-что интересное.

Когда речь идет о персонализации образовательного контента, чаще всего это либо адаптация сложности материалов под конкретного студента, либо подбор тем в соответствии с его предпочтениями. В первом случае система анализирует уровень знаний пользователя и предлагает материалы соответствующей сложности, помогая избежать фрустрации или, наоборот, недостаточной нагрузки. Во втором случае фокус смещается на удержание: пользователь получает контент, который ему интересен, что увеличивает вероятность вовлеченности и регулярного взаимодействия с платформой. В исследовании, проведенном командой Стэнфордского университета, рассматривался именно второй вариант – подбор контента на основе предпочтений пользователя. Исследователи стремились выяснить, насколько персонализированные рекомендации могут повысить вовлеченность учащихся и повлиять на их образовательное поведение.

Объектом исследования стало приложение Freadom – мобильный и веб-сервис для детей, изучающих английский язык. До эксперимента контент в нем подбирался редакторами, но затем было решено внедрить систему персонализированных рекомендаций. В течение двух недель пользователи были разделены на две группы: контрольная продолжала получать редакторские подборки, а экспериментальная – персонализированные рекомендации.

Результаты оказались впечатляющими:

Вовлеченность в персонализированном разделе выросла на 60% (S.E. 17%);
Общее использование приложения увеличилось на 14% (S.E. 7%);

То есть, вместо того чтобы просто перераспределить внимание внутри приложения, персонализированные рекомендации в целом увеличили время взаимодействия с образовательным контентом.

Интересно то, что в статье подробно описывается методология и дизайн эксперимента, что позволяет не просто почитать, а попробовать перенести на свой продукт.

Любой исследовательский результат требует проверки на подводные камни. Я выделила три спорных момента в данном исследовании:

Максимальный эффект наблюдался у пользователей с историей взаимодействий. Это значит, что вовлекать удалось в первую очередь тех, кто уже мотивирован. Да, эффект есть у всех, но для новых пользователей он меньше.
Система плохо работает с новичками. Авторы признают, что если пользователь только что зарегистрировался, рекомендации пока для него неэффективны – модели просто не хватает данных.
Эксперимент длился всего две недели. А это значит, что он не учитывает долгосрочную динамику, например, возможную потерю мотивации спустя месяц или два.

Наиболее логичным подходом в этом контексте становится матричная факторизация. Смысл в том, что у студента могут быть предпочтения по темам контента, а у каждой единицы контента – свои характеристики.

Алгоритм, обученный на данных оценок пользователей, предсказывает значения в матрицах «пользователь» и «контент», формируя рекомендации. Это означает, что система анализирует взаимодействие пользователя с разными материалами и находит закономерности, которые позволяют предлагать наиболее релевантный контент.

Этот метод уже давно применяется в EdTech, например:

Coursera – рекомендует курсы на основе завершенных занятий.
Khan Academy – предлагает материалы, соответствующие уровню знаний ученика.
Duolingo – адаптирует упражнения в зависимости от ошибок пользователя.

Но отличие приложения, на пользователях которого проводили эксперимент в том, что оно использует персонализацию не для построения образовательного трека, а именно для вовлечения – чтобы учащийся проводил в приложении больше времени. И здесь есть интересная оговорка: нет доказательств, что вовлеченность напрямую связана с образовательным эффектом.

Рост вовлеченности пользователей напрямую влияет на монетизацию образовательных платформ. Увеличение общего времени, проведенного в приложении, и частоты взаимодействий с контентом будет работать на:

Повышение конверсии в платные подписки за счет формирования привычки к использованию;
Рост рекламных доходов (если модель монетизации включает рекламу);
Увеличение повторных покупок контента, дополнительных курсов и сервисов.

Таким образом, персонализированные рекомендации могут стать не только инструментом повышения образовательной эффективности, но и способом значительного увеличения выручки.

Допустим, у нас есть онлайн-платформа для изучения программирования, где пользователи проходят курсы, оставляют оценки и взаимодействуют с контентом. Мы хотим персонализировать рекомендации курсов на основе предпочтений пользователей.

1. Представим, что у нас есть матрица взаимодействий пользователей с курсами, где строки — это пользователи, а столбцы — курсы. Значения в матрице — это оценки, которые пользователи поставили курсам (например, от 1 до 5), либо их отсутствие (если пользователь курс не проходил или отказался ставить оценку).

“?” — означает, что пользователь не проходил курс и оценка отсутствует.

2. Матричная факторизация позволяет разложить эту матрицу на две меньшие:

Матрица предпочтений пользователей (размерность: пользователи × скрытые характеристики)
Матрица характеристик курсов (размерность: скрытые характеристики × курсы)

Скрытые характеристики могут включать: уровень сложности курса, популярность тематики, практическую направленность, формат контента (текст, видео, задания). В результате факторизации мы получаем приближенные оценки пропущенных значений, что позволяет рекомендовать пользователям курсы, которые им, вероятно, понравятся.

3. После разложения матрицы мы можем предсказать, какие курсы будут интересны пользователю. Допустим, система вычислила, что User 1 скорее всего поставил бы 4 балла за SQL, а 5 баллов за Web Development. Значит, можно предложить User 1 именно эти курсы, увеличивая вероятность их выбора.

4. Если у нас есть дополнительные данные о пользователях (возраст, профессия, предпочтения в формате обучения), то можно усложнить модель, добавив многофакторный анализ или использовать нейросети для более точных рекомендаций.

Матричная факторизация хорошо работает для большого количества пользователей и простого взаимодействия при не очень большом количестве информации о пользователе. Но как только появляются дополнительные данные о предпочтениях и характеристиках пользователей, их необходимо учитывать, что приводит нас к необходимости многофакторного анализа – и матрица становится многомерной.

Я изучила, какие решения предлагают для этого, и не нашла ничего лучше предсказательных ML-моделей. Добро пожаловать в увлекательный мир нейросетей!

С ходу я не смогла освоить всю необходимую математику, но теперь понимаю, почему Amazon, Яндекс и Google инвестируют миллиарды в нейросети – они позволяют анализировать поведение пользователей и управлять их вниманием.

Пошла устанавливать Jupyter и учить Python!

Если вам интересно про работу в EdTech, исследования образовательных технологий - делюсь всеми находками и мыслями в Telegram-канале. – заходите, я там ничего не продаю и не кусаюсь!

Как персонализированные рекомендации в EdTech повышают вовлеченность и выручку

Введение в проблему: зачем персонализация в EdTech?

Где подвох? Критический взгляд на результаты

Как работает персонализированная рекомендация?

Персонализация и выручка: где связь?

Пример матричной факторизации для образовательного продукта

Итог: куда двигаться дальше?