Насколько большой YouTube?

Этим вопросом задался профессор Массачусетского университета, который сподвиг своего друга на исследование структуры YouTube - самой большой видео площадки в мире. Благодаря им мы с научной точностью можем судить о контенте на YouTube и судить, к примеру, о реальной популярности понравившегося нам ролика.

Почему так интересен YouTube?

Платформа весьма репрезентативна: на ней проводит время значительная часть жителей мира, и она больше, чем любая другая аналогичная площадка. Так, по данным Pew, 93% (!!) всех подростков пользуются YouTube, тогда как у Tiktok - 63% и Snapchat - 60%.

В чем сложность получить выборку для YouTube?

У других платформ гораздо проще вытянуть необходимые для анализа данные через API, но не у YouTube. Поэтому для YouTube не было простой возможности получить статистически достоверную выборку для анализа. А без статистически точной выборки корректные выводы делать просто невозможно.

Профессор так был одержим задачей "посчитать YouTube", что его друг Джейсон Баумгартнер нашел способ сделать случайную (в научном смысле слова) выборку, которая позволяет точно представить структуру контента YouTube. У сервисов есть незадокументированные API, есть и у YouTube. На основе этого знания они смогли сгенерить рандомные URL роликов.

Изучив API платформы, энтузиасты вычислили формулу, по которой формируется URL-адреса YouTube, и нашли способ генерировать случайные адреса внутри заданного диапазона. Другой исследователь написал целую кучу скриптов и за несколько месяцев исследователи собрали более 10 тыс. математически случайных видеороликов с YouTube. Оказывается, существует 2 в 64-ой степени возможных адреса YouTube, что огромное число: 18,4 квинтиллиона.

Размер выборки на сайте tubestats.org и оценка общего числа загруженных роликов на основе этой выборки<br />
Размер выборки на сайте tubestats.org и оценка общего числа загруженных роликов на основе этой выборки

Что мы узнаем о YouTube

В 2023 г. на платформу было залито почти 4 млрд видео, а общее число роликов - 13,325 млрд.

Общее количество загруженных роликов на YouTube. Данные tubestats.org<br />
Общее количество загруженных роликов на YouTube. Данные tubestats.org
Количество загружаемых ежегодно роликов на YouTube. Данные tubestats.org
Количество загружаемых ежегодно роликов на YouTube. Данные tubestats.org

Попасть в топы YouTube крайне сложно: 66% видео не имеют ни единого лайка, 72,9% - ни единого комментария.

YouTube обычно рекомендует нам видео, набравшие не менее 10 тыс. просмотров, в то время как среднее видео на YouTube - 39 просмотров, без единого лайка или комментария*. Это значит, YouTube рекомендует нам супер популярные видео, а не просто "случайное" видео, которые подходят на наши интересы.

Количество просмотров роликов на YouTube. Данные tubestats.org
Количество просмотров роликов на YouTube. Данные tubestats.org

На основе выборки из почти 25 тыс. видео мы знаем:

  • Почти треть роликов (31,8%) - на английском, второй по популярности - хинди (10,5%), третий - испанский (7,9%). На русском - 5,6% роликов (6-место, после арабского)
  • Видео с просмотрами свыше 1 тыс. составляют менее 15%
  • 59% видео аналитики отнесли к категории “люди и блоги” (вероятно, авторские каналы). Игры и развлечения замыкают топ-3.
  • Контент для взрослых составляет менее 0,5%
Язык роликов на YouTube. Данные tubestats.org
Язык роликов на YouTube. Данные tubestats.org

Все данные собираются на сайте tubestats.org и регулярно обновляются

* нужно оговориться, что это именно среднее, где в том числе есть данные по роликам из первых годов жизни YouTube, когда у платформы была гораздо меньше аудитория. От года к году средние показатели по просмотру роликов, лайкам и комментариям, несомненно, росли, и сравнивать эти показатели в 2006-2007 и в 2022-2023 годах напрямую, в абсолютных числах, будет некорректно.

Я собираюсь и дальше писать тут на волнующую меня тему новых технологий. Пожалуйста, поддержите меня, поставьте лайк!

99
2 комментария

Изабелла, пожалуйста! Если несложно - поставьте лайк, поддержите мой труд!)