Вопросы про Telegram к «лучшему агрегатору новостей от ФБК»

Команда Навального выпустила сервис агрегации новостей, но его качество выдачи Telegram-постов вызывает вопросы

Вопросы про Telegram к «лучшему агрегатору новостей от ФБК»

В мессенджере Telegram не существует официального каталога каналов, и пользователи давно сделали свои. Сначала как отдельные каналы о каналах, затем — как сайты со списками каналов, а вершиной эволюции стали автоматизированные сервисы, индексирующие Telegram и предоставляющие статистику по каналам. Самый популярный из них по посещаемости — TGStat.ru — представляет из себя два инструмента: рейтинг (каталог) каналов с аналитикой по каждому, и рейтинг публикаций. Каталог пользуется большой популярностью среди администраторов, TGStat стал основным средством для планирования рекламных кампаний. Рейтинг публикаций тоже используется, но гораздо реже, потому что пользы для администраторов он не несет практически никакой.

Эта статья — не реклама TGStat.ru как агрегатора новостей (потому что TGStat не имеет ничего общего с агрегаторами новостей и используется только специфической аудиторией, администраторами Telegram-каналов, для закупки рекламы). Просто для проверки эффективности работы агрегатора Telegram-постов TGStat.ru подходит идеально.

Пройдем по тезисам о проекте ФБК — Trrending.today:

Сервис показывает все посты

Совершенно нет. Так получилось, что самый популярный (и самый просматриваемый) Telegram-канал на русском — Mash. Легко убедиться, что из ста самых просматриваемых постов в Telegram за неделю 94 относятся к нему. Если мы посмотрим на выдачу Trrending.today за неделю, то обнаружим, что в ней только 4 из 30 постов созданы Mash. Сотый по просмотрам пост, который находит TGStat.ru — 174 тысячи просмотров. Тридцатый в Trrending.today — 66 тысяч.

Топ выдачи TGStat.ru
Топ выдачи TGStat.ru
Топ выдачи Trrrending.today
Топ выдачи Trrrending.today

Тут мне могут справедливо напомнить, что по словам создателей:

«В телеграме мы отслеживаем количество абсолютных просмотров у записи. При этом пост, у которого больше всего просмотров или лайков, не обязательно окажется самым популярным: алгоритм умеет учитывать влияние накруток и других особенностей платформ».

Это будет разумное замечание, к которому мы вернемся позже. А пока рассмотрим проблему, которая возникает из-за того, что не все посты показываются сервисом.

Топ показывает, кто делал самые популярные записи за последние 30 дней

Нет, это не так.

Как сказано в описании:

«Топ пользователей самый лучший. Там нет чуваков с накрученными миллионами подписчиков, топ формируется из тех, кто делал самые популярные записи за последние 30 дней. То есть если у нас кто-то в топе, то его за месяц читало максимальное количество живых людей».

Но мы уже разобрались, что сервис не выводит в топ все посты. Как же он тогда может справедливо рассчитывать рейтинг? Сравнивать его с чем-то невозможно, потому что непонятна методология: сервис смотрит по количеству самых популярных постов за день? За неделю? Сервис учитывает, что одни выпускают по сто постов в месяц, а другие — по тридцать? Сервис учитывает, что чьи-то посты репостятся, а чьи-то набирают просмотры за счет своих подписчиков?

Топ-3 за месяц — «Сталингулаг», «Mash», «Футляр от виолончели». Если посмотреть по TGStat, выяснится, что средний охват одного поста у Сталингулага — 219.4 тысячи, у Mash — 228.7 тысячи, у Футляра — 117.8 тысячи. При этом Сталин постит в среднем 6 раз в неделю, Mash — 21 раз в день, Футляр — 11 раз в день. Никаких «выбросов» по просмотрам у Сталина не было. Так на каком основании он первый? На основании того, что посты Mash по какой-то причине не входят в статистику?

Оставим Mash, этот пример приелся. Возьмем другие каналы — например, «Метро Петербурга» и «Пикабу». Метро в рейтинге Trrending.today на одну позицию выше. Смотрим статистику: средний охват одной записи Пикабу — 79,7 тысяч просмотров. Средний охват одной записи Метро — 62,5. Максимальный средний охват поста за последние тридцать дней у метро — 62 тысячи просмотров. Минимальный средний охват поста у Пикабу — 76 тысяч просмотров. Почему я должен поверить, что Метро более популярное?

Стоит заметить, что я могу себе представить алгоритм подсчет просмотров, при котором такой топ (для данных конкретных примеров) будет справедлив. Однако без четкой методологии и со слоганом «если у нас кто-то в топе, то его за месяц читало максимальное количество живых людей», рейтинг выглядит странно и по большей части неадекватно. Тем более что...

Агрегатор учитывает все каналы

Тогда найдите, пожалуйста, в списке каналов, МДК (входит в топ-5 каналов по версии TGStat), Двач (входит в топ-5 каналов по версии TGStat), Лентач и десятки других. Или подскажите, как их добавить в самый честный агрегатор новостей (это действительно важная проблема — сейчас если канал не добавили программисты ФБК, сделать так, чтобы его начали учитывать, невозможно).

Агрегатор учитывает русскоязычные каналы

Проблема российского Telegram в том, что адски сложно понять, где он начинается и заканчивается. На заре каналов российские ресурсы постоянно путались с узбекскими, а сейчас еще и с украинскими. К счастью, есть автоматическая и ручная модерация. Но сервис Trrending.today этими проблемами не смутить — он специализируется на русскоязычных каналах, и в этом нет ничего неправильного — каждый сам определяет свою специализацию. А еще в рейтинге почему-то есть «LowcostUA» (классные, но пишут на украинском) и «BotNews» (пишут только на английском). Хотя есть и «Строго по-мужски» (аудитория которого полностью из Узбекистана, хотя посты там на русском). Игнорируя, например, «Dubilet» и «*** Харьков» (топовые русскоязычные украинские каналы, кратно превышающие по просмотрам сотый в топе Trrending.today канал). Но это уже относится к проблеме «мало каналов в базе».

Агрегатор учитывает накрутки и понижает накрученные посты в выдаче

Это было бы круто, хотя и звучит как предлог для цензуры. Так что было бы неплохо описать этот алгоритм. А то все же странно получается, что условная «Жизнь Ютуб» находится (при максимальном среднем охвате поста в 32 тысячи просмотров) на 21 месте в рейтинге, а «Давыдов.Индекс» (посты которого за пару дней набирают 150-200 тысяч просмотров) — на 68. Я знаю, что «Давыдов.Индекс» довольно мощно загружен ботами, но технически это сложно отследить, как и ввести распознавание «свой-чужой» в деле накруток. Эксперты говорят, что если накрутка не идет «в лоб», вычислить ее невозможно. Если у команды Trrending.today это получилось, весь рынок был бы готов закидывать ее деньгами только за эу оду фичу.

Агрегатор позволит «за одну минуту узнать, что происходит в стране»

И по сравнению с этим все мелочи отходят на второй план. В идеальном мире так бы и происходило, если бы посты отбирались специально обученными редакторами, кусочки информации собирались вместе, а сама информация проверялась. Oh wait, это вдруг стало очень напоминать СМИ. На практике же в системе, где нет модерации (хотя есть магия чисел с рейтингом постов и нет десятков источников постов, как, собственно, и самих постов), лента превращается в хаос. Зайдем, например, в ленту за 9 ноября. Не так важно, что четыре поста из 30 — рекламные, важно то, что из первых 30 постов ровно ноль упоминают текущий топ-5 Яндекс.Новостей. Там есть отличная история Алапаевского металлургического завода, очень смешной пост с Пикабу, ссылка на видео «Как разорить Биномо» и даже вчерашний пост о запуске самого Trrending.today (сутки же бывают разные). А вот актуальной новостной повестки, увы, нет.

Инициатива эта замечательная. Но реальную жизнь рунета я вижу каждый день в своей личной, тонко настроенной ленте. Там есть и оппозиция, и провластное, и полезные статьи. Есть много вариантов развития ресурса, представленного ФБК, и он может быть очень полезным и крутым. Но сейчас — это красивый, но криво работающий сборник непонятно чего, с неполноценной и некорректной базой каналов, у которых еще и непонятно почему скрыты некоторые посты. В прекрасной России будущего такому продукту не будут рады.

1919
10 комментариев

Все эти автоматические "тренды" и "агрегаторы", орентируются на активность большинства пользователей. Как известно большинство кликающих сутки напралет в интернете не самые умные люди. Пэтому в дзенах/трендах ютуба и в агрегаторе фбк, будет трешёвый хайповый контент за исключением когда владельцы модерируют выдачу в свою пользу.

8
Ответить

еще бы слово "напролёт" написали вы верно, я бы два плюса поставил :)

2
Ответить

..важно то, что из первых 30 постов ровно ноль упоминают текущий топ-5 Яндекс.Новостей.Вот это действительно странно

7
Ответить

Комментарий недоступен

7
Ответить

Тогда тебе на первый канал. Там каждый день хвала царю и поток новостей про успехи и прорывы.

1
Ответить

Сразу видно — человек в теме не случайный гость.

1
Ответить

То, что в выдаче нет МДК, мэш и прочего воспринимаю как плюс.

1
Ответить