Интерфейс под алгоритмы: почему рекомендации TikTok такие затягивающие

Предприниматель Юджин Вей рассуждает, как слаженная работа механизмов китайской соцсети позволяет системе непрерывно учиться и удерживать более 800 млн пользователей.

Интерфейс под алгоритмы: почему рекомендации TikTok такие затягивающие

Массивы данных и машинное обучение

Удивительно, насколько с недавнего времени улучшилось машинное обучение только за счёт тренировки на больших массивах данных, пусть даже новые алгоритмы не сильно отличаются от старых. Один из примеров — модель GPT-3. Она пишет поэмы и техническую документацию, генерирует табулатуры и решает математические задачи.

В некоторых областях данных для обучения много: корпусы текстов для языковых моделей, фотобанки для визуального ИИ. Но у TikTok поначалу не было ни базы с короткими видео (с мемами, танцующими детьми и рекламой брендов), ни данных о том, нравятся ли они пользователям. Сервису оставалось самому стать источником тренировочных массивов.

Интерфейс и алгоритмы рекомендаций

Когда речь заходит об алгоритмах китайской соцсети, многие представляют себе волшебный фрагмент кода. Но знатоки отрасли считают, что в целом TikTok подходит к решению задач машинного обучения сходно с остальными компаниями.

Для сервисов вроде TikTok успех во многом зависит от того, как работают алгоритмы машинного обучения. И чтобы они работали на вас, сначала нужно поработать над ними — помочь им «увидеть», замечает Веи.

Перед тем как видео попадёт в ленту рекомендаций пользователя, его посмотрит сотрудник отдела по контенту и расставит метки:

  • Что на видео: танцы, пение под фонограмму, видеоигры, котёнок, еда.
  • Кто на видео: мужчина или женщина, сколько их, какого они возраста.
  • Где происходит действие.
  • Какие фильтры и эффекты.

Видео также анализирует система ИИ, причём иногда даже во время съёмки: некоторые фильтры в TikTok фиксируют изменения мимики и движения тела.

На начальной странице TikTok отображается только одно видео. Механизм сервиса похож на бесконечную ленту, но на деле у каждого ролика своя страница. Пока воспроизводится один, другие загружаются в фоновом режиме. Такой метод позволяет приложению анализировать отношение к конкретному ролику.

Интерфейс TikTok
Интерфейс TikTok

Каждое действие — сигнал для системы:

  • Если пользователь не досмотрел видео и перешёл к следующему, значит, оно ему не понравилось.
  • Повторное воспроизведение, интерес к музыкальному сопровождению или решение поделиться указывают на увлечённость.
  • Посещение страницы автора и подписка — на высокий интерес.

Ещё алгоритм учитывает, что TikTok уже знает о пользователе:

  • Предыдущие действия.
  • Демографические и психографические характеристики.
  • Где он смотрит видео и на каком устройстве.
  • Какие пользователи на него похожи.

TikTok собирает достаточно данных даже за короткое время. Ролики небольшие — и пользователь точно посмотрит несколько. А пролистывать нудные видео ему даже приятно, ведь он знает: в будущем алгоритм учтёт предпочтения.

Бесконечная прокрутка и негативная оценка публикаций

Ленты многих соцсетей давно работают на алгоритмах. Чаще всего они устроены по принципу бесконечной прокрутки и отображают сразу несколько элементов. Но в таком случае алгоритм не узнает, какая публикация привлекла внимание пользователя и как он к ней отнёсся.

Возможно, он забыл поставить отметку «Нравится» или хотел возразить, но передумал, потому что автор — его друг или коллега. Алгоритм не может распознать отрицательный отклик, нет негативной обратной связи. Некоторые платформы позволяют указывать на содержание нежелательного характера, но эти функции «спрятаны», и поэтому ими редко пользуются.

Такие ленты формируют Facebook и Instagram (оба запрещены в России), а также Twitter. Они ориентируются в первую очередь на социальные графы: учитывают возраст, родной город, подписки на сообщества и предпочтения «друзей». Недостаток — интересы пользователя могут не совпадать с интересами «друзей», часть из которых он едва знает.

Reddit использует графы интересов и поэтому разработала механизм отрицательных оценок. Главная задача площадки — удержать пользователей за счёт увлекательного контента, а для этого необходимо отсеять неподходящий.

Эту же цель ставит TikTok, хотя очевидной негативной отметки для видео в нём не предусмотрено. Алгоритм учится считывать отрицательную реакцию сам — по отсутствию положительного отклика и досрочному перелистыванию. Впрочем, за долгим нажатием на видео всё же спрятана функция «Не интересно».

Восприимчивость алгоритма вынуждает создателей контента завлекать зрителей. Один из популярных приёмов — использование «вирусных» песен. Скорее всего, пользователь прослушает фрагмент несколько раз и дождётся кульминации. Но в видео её может и не быть. Поэтому авторы нередко добавляют «результат в конце» или «обязательно досмотри», чтобы создать интригу.

Бесконечно прокручивающейся лентой разработчики Facebook (запрещён в России) и Twitter надеются упростить взаимодействие с приложением: при желании пользователь прокрутит полтора десятка публикаций одним касанием. В TikTok видео листают «смахиванием». Не так удобно, но точные рекомендации это компенсируют.

Пользователям Twitter, к примеру, нередко приходится «игнорировать» и блокировать неугодных комментаторов, «чистить» подписки и отписывать от себя нежелательных читателей. Они часто недовольны, что в их ленте показывают публикации, понравившиеся другим.

Это указывает на плохо отлаженную работу сервиса. Если бы алгоритмы распознавали интересы конкретного пользователя, ему бы не пришлось «игнорировать» цепочки публикаций и блокировать авторов. Скорее всего, он бы с ними не столкнулся.

Кроме того, ориентируйся разработчики на графы интересов, а не социальные графы, Twitter мог бы обойтись и без подписок — занимательный контент подбирался бы подобно рекомендациям TikTok.

Такое проектирование интерфейса позволяет алгоритмам китайской соцсети постоянно учиться, и поэтому сервисам вроде Reels или Triller может быть трудно её догнать.

4040
26 комментариев

Украду картинку, посты Морейниса комментировать
  

1

Все хейтят телевизор. Алгоритмы тик-тока - это будущее того же самого «нового» телевидения.

7

во-во, и главное гоооордые - я не смотрю телик, он для зомби!
(Потом пошел в инсту и тик-ток)

11

Комментарий недоступен

Вот бы тик-ток после пользования им мог сказать насколько я дебил, в процентах.

6

если используешь ТТ, то 100% - Да

10