Интерфейс под алгоритмы: почему рекомендации TikTok такие затягивающие Статьи редакции

Предприниматель Юджин Вей рассуждает, как слаженная работа механизмов китайской соцсети позволяет системе непрерывно учиться и удерживать более 800 млн пользователей.

Массивы данных и машинное обучение

Удивительно, насколько с недавнего времени улучшилось машинное обучение только за счёт тренировки на больших массивах данных, пусть даже новые алгоритмы не сильно отличаются от старых. Один из примеров — модель GPT-3. Она пишет поэмы и техническую документацию, генерирует табулатуры и решает математические задачи.

В некоторых областях данных для обучения много: корпусы текстов для языковых моделей, фотобанки для визуального ИИ. Но у TikTok поначалу не было ни базы с короткими видео (с мемами, танцующими детьми и рекламой брендов), ни данных о том, нравятся ли они пользователям. Сервису оставалось самому стать источником тренировочных массивов.

Интерфейс и алгоритмы рекомендаций

Когда речь заходит об алгоритмах китайской соцсети, многие представляют себе какой-то волшебный фрагмент кода. Но знатоки отрасли считают, что в целом TikTok подходит к решению задач машинного обучения сходно с остальными компаниями.

Для сервисов вроде TikTok успех во многом зависит от того, как работают алгоритмы машинного обучения. И чтобы они работали на вас, сначала нужно поработать над ними — помочь им «увидеть», замечает Веи.

Перед тем как видео попадёт в ленту рекомендаций пользователя, его посмотрит сотрудник отдела по контенту и расставит метки:

  • Что на видео: танцы, пение под фонограмму, видеоигры, котёнок, еда.
  • Кто на видео: мужчина или женщина, сколько их, какого они возраста.
  • Где происходит действие.
  • Какие фильтры и эффекты.

Видео также анализирует система ИИ, причём иногда даже во время съёмки: некоторые фильтры в TikTok фиксируют изменения мимики и движения тела.

На начальной странице TikTok отображается только одно видео. Механизм сервиса похож на бесконечную ленту, но на деле у каждого ролика своя страница. Пока воспроизводится один, другие загружаются в фоновом режиме. Такой метод позволяет приложению анализировать отношение к конкретному ролику.

Интерфейс TikTok

Каждое действие — сигнал для системы:

  • Если пользователь не досмотрел видео и перешёл к следующему, значит, оно ему не понравилось.
  • Повторное воспроизведение, интерес к музыкальному сопровождению или решение поделиться указывают на увлечённость.
  • Посещение страницы автора и подписка — на высокий интерес.

Ещё алгоритм учитывает, что TikTok уже знает о пользователе:

  • Предыдущие действия.
  • Демографические и психографические характеристики.
  • Где он смотрит видео и на каком устройстве.
  • Какие пользователи на него похожи.

TikTok собирает достаточно данных даже за короткое время. Ролики небольшие и пользователь точно посмотрит несколько. А пролистывать нудные видео ему даже приятно, ведь он знает: в будущем алгоритм учтёт предпочтения.

Бесконечная прокрутка и негативная оценка публикаций

Ленты многих соцсетей давно работают на алгоритмах. Чаще всего они устроены по принципу бесконечной прокрутки и отображают сразу несколько элементов. Но в таком случае алгоритм не узнает, какая публикация привлекла внимание пользователя и как он к ней отнёсся.

Возможно, он забыл поставить отметку «Нравится» или хотел возразить, но передумал, потому что автор его друг или коллега. Алгоритм не может распознать отрицательный отклик, нет негативной обратной связи. Некоторые платформы позволяют указывать на содержание нежелательного характера, но эти функции «спрятаны», и поэтому ими редко пользуются.

Такие ленты формируют Facebook, Instagram и Twitter. Они ориентируются в первую очередь на социальные графы: учитывают возраст, родной город, подписки на сообщества и предпочтения «друзей». Недостаток — интересы пользователя могут не совпадать с интересами «друзей», часть из которых он едва знает.

Reddit использует графы интересов и поэтому разработала механизм отрицательных оценок. Главная задача площадки — удержать пользователей за счёт увлекательного контента, а для этого необходимо отсеять неподходящий.

Эту же цель ставит TikTok, хотя очевидной негативной отметки для видео в нём не предусмотрено. Алгоритм учится считывать отрицательную реакцию сам — по отсутствию положительного отклика и досрочному перелистыванию. Впрочем, за долгим нажатием на видео всё же спрятана функция «Не интересно».

Восприимчивость алгоритма вынуждает создателей контента завлекать зрителей. Один из популярных приёмов — использование «вирусных» песен. Скорее всего, пользователь прослушает фрагмент несколько раз и дождётся кульминации. Но в видео её может и не быть. Поэтому авторы нередко добавляют «результат в конце» или «обязательно досмотри», чтобы создать интригу.

Бесконечно прокручивающейся лентой разработчики Facebook и Twitter надеются упростить взаимодействие с приложением: при желании пользователь прокрутит полтора десятка публикаций одним касанием. В TikTok видео листают «смахиванием». Не так удобно, но точные рекомендации это компенсируют.

Пользователям Twitter, к примеру, нередко приходится «игнорировать» и блокировать неугодных комментаторов, «чистить» подписки и отписывать от себя нежелательных читателей. Они часто недовольны, что в их ленте показывают публикации, понравившиеся другим.

Это указывает на плохо отлаженную работу сервиса. Если бы алгоритмы распознавали интересы конкретного пользователя, ему бы не пришлось «игнорировать» цепочки публикаций и блокировать авторов. Скорее всего, он бы с ними не столкнулся.

Кроме того, ориентируйся разработчики на графы интересов, а не социальные графы, Twitter мог бы обойтись и без подписок — занимательный контент подбирался бы подобно рекомендациям TikTok.

Такое проектирование интерфейса позволяет алгоритмам китайской соцсети постоянно учиться, и поэтому сервисам вроде Reels или Triller может быть трудно её догнать.

0
26 комментариев
Написать комментарий...
Денис Караван
Ответить
Развернуть ветку
i h8ers

Украду картинку, посты Морейниса комментировать
  

Ответить
Развернуть ветку
Vova Kira

Все хейтят телевизор. Алгоритмы тик-тока - это будущее того же самого «нового» телевидения.

Ответить
Развернуть ветку
Григорий

во-во, и главное гоооордые - я не смотрю телик, он для зомби!
(Потом пошел в инсту и тик-ток)

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
shmitter

Вот бы тик-ток после пользования им мог сказать насколько я дебил, в процентах.

Ответить
Развернуть ветку
Lace Up

если используешь ТТ, то 100% - Да

Ответить
Развернуть ветку
Константин Рогов

Судя по глубине оналитеги Юджин Вей китайский школьник

Ответить
Развернуть ветку
НеМосков

Хз, если в ТТ смотреть что-то интересное(спортивные нарезки, арт, митинги, скетчи и т.д) то вполне себе нормальная платформа. Если вы смотрите на танцующих баб - конечно, вам будут чаще баб пихать. Правда, ТТ все равно в твои рекомендации может пихнуть ЛГБТшников, трансов и прочую человеческую многоножку 

Ответить
Развернуть ветку
Anderson Silva

Китайцы не перестают удивлять.

Ответить
Развернуть ветку
Tim А.

Секрет в том, что всегда проще деградировать

Ответить
Развернуть ветку
Илья Фирсов

скорее не проще, а просто для этого ничего не надо делать. к сожалению это выбор многих...

Ответить
Развернуть ветку
Peter Starokadomskiy

Автор неправ в том, что лента в фб создаётся на основе социального графа. ФБ анализирует взаимодействие с каждым постом: была ли пауза при скролле, сколько пользователь провел времени на посте той или иной тематики (каждый пост также промечается алгоритмами), читал ли он комментарии и тд. И исходя уже из этого строится персонализированная лента.

Ответить
Развернуть ветку
Roma Schreibikus

Ютуб тоже.
Да и все остальные соцсети.
Смысл статьи : тик ток использует аналитику для формирования ленты, вот это да.

Ответить
Развернуть ветку
Andreas Kraut

Пофиг на ленты. Почти не смотрю в них. Сразу иду в нужный мне акк, чтобы посмотреть добавилось ли там что-то... на важные акк ставлю нотификацию. новости - RSS и телеграм..Никаких лент и рекомендаций в итоге.

Ответить
Развернуть ветку
Илья Фирсов

т.е. интересует только один акк и все? странное пользование программой, где миллионы роликов ;)

Ответить
Развернуть ветку
Andreas Kraut

Не один, а несколько, и я не про тик ток , а в общем... в любой сети ленты надоедают, они слишком разрозненно подают информацию, я просто исхожу из принципа необходимости в моменте - на тот акк захожу и смотрю сразу посты за неделю, например. 

Ответить
Развернуть ветку
Илья Фирсов

ну иногда и хочется с разных сфер информацию, листая нормальную ленту можно много информации получить. конечно если это не рекламные аккаунты, от которых толку 0

Ответить
Развернуть ветку
Stanislas

Ё маё, стало немного страшно

Ответить
Развернуть ветку
Илья Фирсов

так же подумал :) аж рука потянулась удалить сие зло с моего телефона :)

Ответить
Развернуть ветку
Месье Никита

Удаляйте и даже не думайте. 

Ответить
Развернуть ветку
Илья Фирсов

чуть ошибся. с телефона оно уже давно удалено. а вот на планшете посматриваю иногда...

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Отнюдь

главное чтобы потом не выяснилось, что искусственный интеллект это две деревни по миллиону человек в каждой сидят и ручками хуячат рекомендации эти

Ответить
Развернуть ветку
Илья Фирсов

даже если так, то вряд ли мы об этом узнаем. хотя интересная теория...

Ответить
Развернуть ветку
Николай Глущенко

Не знаю чего затягивающего в тик-токе, меня он подбешивает. Постоянно сыпет всякий мусор в рекомендации, причём быстрый свайп не помогает - запросто может забросить в ленту 5 подряд роликов одного блогера, ролик которого просмотрел один раз когда-то давно. Создаётся впечатление что мои предпочтения Тик-Ток понимает, но настойчиво их игнорирует) Уже не помню когда последний раз туда заходил, это надо много выпить чтобы там лазить)

Ответить
Развернуть ветку
Vlad AmHvost

Простейшая геймфикация и позетивная коннотация интерфейса и механик, очень хорошо работает на душевных струнах человека, который может сколько угодно расжудать о негативности либеральных ценностей и подобном пользовательском опыте, но как любой человек сам вырос на таких же механиках. Все зачастую и расматиривают себя и свой опыт с такой же лояльностю с какой ему предлагают реагировать относительно других и их опыта. Оправдывая действия с негативными последвиями вместо обьективного анализа, или переоценивая свои достижения и цености исходя из общественных устоев. А потом удивляется почему пропадают дизлайки, или почему так затягивают алгоримты. Именно потому, что человек не машина и способен заниматься самообманом и другими ухирщениями, для комфортного существанония внутри сообщества таких же людей - машиный анализ очень эффективно может анализировать и получать выгоду из всего этого.. Только подход пока еще очень узкоспециализированый и стороится на запросах выгодополучателя, а не системном учете всего. Все только начинаеться, ребята.

Ответить
Развернуть ветку
23 комментария
Раскрывать всегда