Диёр Хайдаров

+26
с 09.04.2024

Директор и основатель https://iota.uz. Программист, ML/DL специалист.

4 подписчика
0 подписок

Спасибо за конструктивный фидбек Михаил.

В статье есть ссылка на GitHub и данные. Покажите как надо. Был бы рад чему-то научиться

Нет, но в коде есть пример как отделить новости используя KMeans.

Из данных были исключены статьи помеченные как реклама и для графиков были удалены "outliers"

1

Так статья не отрицает первостепенности качества контента, мы только хотели понять что еще коррелирует с успехом статьи

Посмотрите на это с точки зрения программиста/аналитика который увидел возможность провести анализ. И найти не очевидные корреляции

Что поменяли бы в статье что бы она лучше отражала суть эксперимента?

Я думаю здесь и распределение компетенций роль играет. Хочешь не хочешь, экспертность людей в теме распеределяется в "bell curve".
А с количетсвом онлайн курсов по IT последнее время, график сильно съехал влево. (как человек который публиковал вакансии джунов могу потдверить😂)
Вот и результат: одни новички раздают советы другим новичкам.

Замечал такой феномен.
Пишешь техническую статью с дейтвительно полезным и подробным контентом. Потом какой-то школьник который 3-й месяц программирует публикует статью с x10 просмотрами.

1

Так же приветствую всех желающих поиграться с кодом и данными в надежде найти еще что-то интересное.
Данные доступны на Github: https://github.com/iota-agency/experiments/releases/tag/v1.0.0

1

Верно, тоже нахожу это странным.

Тык пальцем в небо: у интересных статей длинные заголовки

1

Если верить данным, длинный заголовок + короткий контент идеальная комбинация.

В одном из графиков видно что у коротких статей значительно больше комментариев.

Ахаха, не могу не согласиться. Корреляции и козация - не одно и то же