Анализ статей vc.ru за 2021 год

Прочитала исследование Дениса Кулькова и решила посмотреть на данные по всем статьям за 2021 год. Статьям тип вручную не присваивала (разметить вручную 100 тысяч статей невозможно), брала только данные, которые были в свойствах (добавление в закладки, количество комментариев, количество просмотров и так далее).

Число просмотров больше всего вечером в 20.00.

Просмотры
Просмотры

Положительных оценок больше всего у статей, опубликованных в 5 утра.

Оценки
Оценки

Комментариев больше всего у статей, опубликванных в 8 утра.

Комментарии
Комментарии

По добавлению в закладки - максимум в 10 утра.

Закладки
Закладки

Если не учитывать подсайт unknown, в котором больше всего статей, то распределение получится такое: на первых местах - маркетинг, финансы и жалобы (приемная).

Подсайты
Подсайты

Облако тегов по всем статьям:

Теги
Теги

И по статьям из unknown:

Теги
Теги

Кто такой levercost?)

Статей с меткой editor, видимо от редакции сайта, выходит крайне мало, по сравнению с остальными:

Тип автора статьи
Тип автора статьи

15 авторов, которые пишут чаще всего:

Авторы
Авторы

Летом и в январе пишут реже:

Количество статей
Количество статей

Просмотры по месяцам. Что случилось осенью 2021, что просмотры упали?

Анализ статей vc.ru за 2021 год

Если рассмотреть топ-5 статей по разным критериям:

По положительным оценкам:

Дальше 4 статьи, с текcтом как у предыдущей, без заголовков, видимо репосты.

По добавлению в закладки:

По количеству комментариев:

По просмотрам:

33
5 комментариев

Я давно говорю что @Евгения Евсеева надо выдать премию, это настоящий стахановец пера.

Хотя может оказаться, что это был @Sergey Zvezda с его алгоритмом.

1
Ответить

нет, мы с Серёжей разные люди! спасибо 💔

2
Ответить

подскажите, что использовали для визуализации графиков?

Ответить

seaborn

Ответить