Что такое дочтения статей и зачем мы их считаем

Летом на Хабре появилась расширенная статистика по контенту. Дочтения — самый полезный новый показатель. Но авторы чаще следят за просмотрами, особенно когда речь заходит о коммерческих статьях.

Под катом я разбираюсь, почему дочтения всё‑таки важны. Бонус: табличка со средними дочтениями, доскроллами и отказами у хороших статей на Хабре.

Что такое дочтения

Дочтения показывают, сколько читателей статьи действительно её прочитали. Понять это мы можем по средней скорости скролла.

Все новые показатели мы считаем в процентах от уникальных читателей 
Все новые показатели мы считаем в процентах от уникальных читателей 

Среди зарубежных авторов дочтения популярны — во многом из‑за того, что вокруг них крутится статистика статьи в Medium.

Чтобы мы могли рассчитать дочтения, фронтенд Хабра отправляет два типа событий:

  • о глубине скролла
  • о времени прохождения каждого участка

Если незарегистрированный читатель когда‑нибудь вернётся в статью и решит прочитать её заново — мы это поймём, если кука сохранилась.

В этом случае в статистике зачтётся одно, самое глубокое прочтение.

Стас Ермаков, старший фронтенд-разработчик Хабра

Почему дочтения важнее просмотров

Чтобы понять важность дочтений, нужно разобраться, зачем люди пишут статьи. Вот модель, которую собрал исследователь медиа Кристиан Фукс.

Вы познаёте мир, делитесь информацией с другими и совместными усилиями совершаете что-то, что меняет мир. Цикл замкнулся, поехали по-новой
Вы познаёте мир, делитесь информацией с другими и совместными усилиями совершаете что-то, что меняет мир. Цикл замкнулся, поехали по-новой

То есть цель статьи как акта коммуникации — подбить других людей на совместное действие. Получится или нет — зависит от успешности коммуникации.

Просмотры не показывают, была ли коммуникация успешной. Благодаря просмотрам мы знаем, что общение, возможно, состоялось. Но это не точно, ведь человек мог даже не читать.

Дочтения — совсем другое дело. Они намекают, что коммуникация была качественной. Всё ещё нет гарантий, что автора правильно поняли. Но его хотя бы прочли.

  • Много просмотров, мало дочтений — кликбейт, информационный шум
  • Мало просмотров, много дочтений — полезная узкоспециализированная статья, которая с высокой вероятностью повлияла на своих читателей

Важный момент: если на статье 10 просмотров, то смотреть на дочтения нет смысла. Дождитесь, пока наберётся хотя бы 500 уникальных читателей.

Сколько дочтений набирают хорошие статьи на Хабре

Новые показатели мы считаем с 25 мая 2024 года. Точно определить что такое «хорошая статья» пока нельзя — данных мало.

Летом Хабр читают хуже, потому что чтение по увлекательности проигрывает пляжу и шашлыку. Это нормально, бороться с шашлыком бессмысленно. С середины сентября метрики растут, но для окончательных выводов нужно ещё подождать.

В интерфейсе статистики ориентировочные значения мы пока не показываем, но чуть позже сделаем это. Вот промежуточный срез от аналитиков Хабра Юли и Лены:

Что такое дочтения статей и зачем мы их считаем

Если доскроллы/дочтения у вас выше, а отказы ниже — поздравляю, вы написали увлекательную статью.

Если показатели не дотягивают, есть смысл что‑то изменить в следующих статьях. @Exosphere как раз недавно опубликовала хорошие рекомендации.

Почему дочтениями редко пользуются

Мы в каком‑то роде первопроходцы: из крупных российских UGC‑платформ подробную статистику с дочтениями никто не показывает. И на это есть две объективные причины.

Во‑первых, собирать дочтения — это технически сложно. Платформа должна заложиться на разработку и поддержку дорогой системы. Есть ещё вариант интегрироваться с внешней системой аналитики, но не все готовы делиться данными (и правильно делают).

Во‑вторых, дочтения сложно гарантировать, из‑за чего с этой метрикой некомфортно работать, если вы продаёте контент. Дочтениями чаще пользуются для себя, а с внешними заказчиками договариваются на просмотры.

Опыта в разработке подобных решений у нас не было, поэтому приходилось импровизировать. Ключевым требованием было предоставление агрегированной статистики в почти реальном времени, чтобы авторы быстро получали актуальную информацию.

Как основную базу данных для хранения и обработки данных мы используем ClickHouse. На пиковых нагрузках наша система успешно обрабатывает до 3000 событий в секунду, обеспечивая быструю и надежную аналитику.

Артём Константинов, старший бэкенд-разработчик Хабра

Зачем дочтения Хабру

Как продакту мне ОЧЕНЬ нужны показатели, с помощью которых можно быстро и адекватно оценить качество статьи. Без этого вагончик дальше не поедет.

Что такое дочтения статей и зачем мы их считаем

Вот реальная продуктовая задача: нужно объективно оценить статью, чтобы решить, попадёт она в блок «Читают сейчас» или нет. Раньше ориентироваться можно было только на просмотры и показатели вовлечения — рейтинг, закладки и комментарии.

Мы уже разобрались, что просмотры не работают при оценке качества. Но на Хабре даже рейтинг не всегда точно показывает, хорошая ли статья. Мы открытая платформа, где среднестатистический читатель — незарег, который отреагировать на статью не может.

С точки зрения рекомендашки дочтения — очень удобный показатель. Он хорошо отражает качество и собирается быстрее, чем тот же рейтинг. Когда на Хабре появится полноценная рекомендательная система, дочтения точно будут играть в ней важную роль.

Что дальше

Мы спрашивали у авторов, чего им не хватает в статистике: чаще всего говорили про источники трафика и показы/клики по превью в лентах. Этим мы и займёмся в ближайшие месяцы.

Если в статистике Хабра не хватает чего-то ещё — напишите об этом в комментариях, буду думать.

Главное, что базовые функции работают без проблем. Основные показатели статистики уже помогают авторам в их непростом труде.

Спасибо всем, кто разрабатывал статистику! Без вас ничего бы не получилось.

  • Алина Файзрахманова (tg: @jillyjj) — подготовка спецификаций
  • Мария Бондаревская (behance) — дизайн и UX страницы статистики
  • Артём Константинов — обработка и хранение данных статистики на бэке
  • Екатерина Бочкарева и Стас Ермаков — отправка пользовательских событий и фронтенд страницы статистики
  • Николай Баутин (@alcochtivo) и Игорь Захаров (@igorzakhar) — тестирование
  • Арина Тулаева (тг‑канал) — маркетинговое сопровождение запуска
  • Ирина Лосева (@jonia) — обучение компаний работе с новой статистикой
  • Департамент инфраструктуры Хабра — стойкость под нагрузкой
  • @Boomburum и @Exosphere — полезные статьи
  • Команда аналитиков Юля и Лена — дельные советы и большое исследование по новым метрикам

Я веду небольшой тг‑канал о внутреннем устройстве медиа, где иногда рассказываю о том, что происходит под капотом Хабра.

Это полезно знать сотрудникам медиа: айтишникам, контентщикам, маркетологам.

1010
1 комментарий

Ну мощь, Артём! Спасибо тебе за работу ещё разок :)

1