Интерфейс под алгоритмы: почему рекомендации TikTok такие затягивающие

Предприниматель Юджин Вей рассуждает, как слаженная работа механизмов китайской соцсети позволяет системе непрерывно учиться и удерживать более 800 млн пользователей.

Удивительно, насколько с недавнего времени улучшилось машинное обучение только за счёт тренировки на больших массивах данных, пусть даже новые алгоритмы не сильно отличаются от старых. Один из примеров — модель GPT-3. Она пишет поэмы и техническую документацию, генерирует табулатуры и решает математические задачи.

vc.ru

Код, статья, вёрстка и музыка: что уже может создать по описанию самый мощный алгоритм генерации текстов OpenAI GPT-3

Это ещё далеко не искусственный интеллект, но уже есть примеры работ, для которых почти не нужны люди.

В некоторых областях данных для обучения много: корпусы текстов для языковых моделей, фотобанки для визуального ИИ. Но у TikTok поначалу не было ни базы с короткими видео (с мемами, танцующими детьми и рекламой брендов), ни данных о том, нравятся ли они пользователям. Сервису оставалось самому стать источником тренировочных массивов.

Когда речь заходит об алгоритмах китайской соцсети, многие представляют себе какой-то волшебный фрагмент кода. Но знатоки отрасли считают, что в целом TikTok подходит к решению задач машинного обучения сходно с остальными компаниями.

Для сервисов вроде TikTok успех во многом зависит от того, как работают алгоритмы машинного обучения. И чтобы они работали на вас, сначала нужно поработать над ними — помочь им «увидеть», замечает Веи.

Перед тем как видео попадёт в ленту рекомендаций пользователя, его посмотрит сотрудник отдела по контенту и расставит метки:

Что на видео: танцы, пение под фонограмму, видеоигры, котёнок, еда.
Кто на видео: мужчина или женщина, сколько их, какого они возраста.
Где происходит действие.
Какие фильтры и эффекты.

Видео также анализирует система ИИ, причём иногда даже во время съёмки: некоторые фильтры в TikTok фиксируют изменения мимики и движения тела.

На начальной странице TikTok отображается только одно видео. Механизм сервиса похож на бесконечную ленту, но на деле у каждого ролика своя страница. Пока воспроизводится один, другие загружаются в фоновом режиме. Такой метод позволяет приложению анализировать отношение к конкретному ролику.

Каждое действие — сигнал для системы:

Если пользователь не досмотрел видео и перешёл к следующему, значит, оно ему не понравилось.
Повторное воспроизведение, интерес к музыкальному сопровождению или решение поделиться указывают на увлечённость.
Посещение страницы автора и подписка — на высокий интерес.

Ещё алгоритм учитывает, что TikTok уже знает о пользователе:

Предыдущие действия.
Демографические и психографические характеристики.
Где он смотрит видео и на каком устройстве.
Какие пользователи на него похожи.

TikTok собирает достаточно данных даже за короткое время. Ролики небольшие и пользователь точно посмотрит несколько. А пролистывать нудные видео ему даже приятно, ведь он знает: в будущем алгоритм учтёт предпочтения.

Ленты многих соцсетей давно работают на алгоритмах. Чаще всего они устроены по принципу бесконечной прокрутки и отображают сразу несколько элементов. Но в таком случае алгоритм не узнает, какая публикация привлекла внимание пользователя и как он к ней отнёсся.

Возможно, он забыл поставить отметку «Нравится» или хотел возразить, но передумал, потому что автор его друг или коллега. Алгоритм не может распознать отрицательный отклик, нет негативной обратной связи. Некоторые платформы позволяют указывать на содержание нежелательного характера, но эти функции «спрятаны», и поэтому ими редко пользуются.

Такие ленты формируют Facebook, Instagram и Twitter. Они ориентируются в первую очередь на социальные графы: учитывают возраст, родной город, подписки на сообщества и предпочтения «друзей». Недостаток — интересы пользователя могут не совпадать с интересами «друзей», часть из которых он едва знает.

Reddit использует графы интересов и поэтому разработала механизм отрицательных оценок. Главная задача площадки — удержать пользователей за счёт увлекательного контента, а для этого необходимо отсеять неподходящий.

Эту же цель ставит TikTok, хотя очевидной негативной отметки для видео в нём не предусмотрено. Алгоритм учится считывать отрицательную реакцию сам — по отсутствию положительного отклика и досрочному перелистыванию. Впрочем, за долгим нажатием на видео всё же спрятана функция «Не интересно».

Восприимчивость алгоритма вынуждает создателей контента завлекать зрителей. Один из популярных приёмов — использование «вирусных» песен. Скорее всего, пользователь прослушает фрагмент несколько раз и дождётся кульминации. Но в видео её может и не быть. Поэтому авторы нередко добавляют «результат в конце» или «обязательно досмотри», чтобы создать интригу.

Бесконечно прокручивающейся лентой разработчики Facebook и Twitter надеются упростить взаимодействие с приложением: при желании пользователь прокрутит полтора десятка публикаций одним касанием. В TikTok видео листают «смахиванием». Не так удобно, но точные рекомендации это компенсируют.

Пользователям Twitter, к примеру, нередко приходится «игнорировать» и блокировать неугодных комментаторов, «чистить» подписки и отписывать от себя нежелательных читателей. Они часто недовольны, что в их ленте показывают публикации, понравившиеся другим.

Это указывает на плохо отлаженную работу сервиса. Если бы алгоритмы распознавали интересы конкретного пользователя, ему бы не пришлось «игнорировать» цепочки публикаций и блокировать авторов. Скорее всего, он бы с ними не столкнулся.

Кроме того, ориентируйся разработчики на графы интересов, а не социальные графы, Twitter мог бы обойтись и без подписок — занимательный контент подбирался бы подобно рекомендациям TikTok.

Такое проектирование интерфейса позволяет алгоритмам китайской соцсети постоянно учиться, и поэтому сервисам вроде Reels или Triller может быть трудно её догнать.

vc.ru

Если не TikTok, то они: чем известны американские конкуренты соцсети и какие у них недостатки — Соцсети на vc.ru

За внимание пользователей могут побороться преемник Vine, «клон TikTok» от Instagram и не очень известный Thriller, который делает ставку на знаменитостей.

#tiktok