Не дайте звездам вас обмануть: Холодный расчет рейтинга.
Шутка из статистики. В деревенском баре сидели бедные мужики, но когда в бар вошел Билл Гейтс, оказалось (по расчетам), что средняя зарплата клиентов бара увеличилась на столько, что они стали миллиардерами.
Эта шутка говорит о важности понимания и интерпретации "Средних" величин.
Кстати по состоянию на 2025 год у Билла Гейтса 107 миллиардов долларов
В этой статье поговорим о "средних", как на них смотреть, как им доверять и что они вообще показывают, посмотрим на уровень достоверности. Кстати будет немного практики а не пустой пересказ статей. А еще мы будем оценивать оценку.
Вернемся к товарам, продажам и их оценкам в виде звезд. На маркетплейсах, где конкуренция за внимание покупателей достигает своего пика, рейтинги и "звездные" оценки играют ключевую роль в формировании имиджа товара. Однако, как можно оценить достоверность этих оценок? Как понять, действительно ли 5 звезд означает высокое качество, или это просто результат манипуляций или случайных обстоятельств?
Из разговора двух отцов.
— Как у твоего сына дела в школе? — спросил первый отец.
— Да, средне, ни то ни сё. У него средний балл 3,5, — ответил второй.
— Фууух, а я за своего начал переживать. У моего тоже, кстати, средняя оценка 3,5.
— Интересно, — задумался первый. — Но давай взглянем на оценки. У твоего в журнале стоят 5, 3, 4, 3, 4, 3, 3, 3, а у моего — 4, 3, 5, 1, 1, 5, 4, 5. Что можно сказать о двух выборках? Они действительно схожи, если оба имеют одинаковую среднюю оценку?
— Я бы сказал, что нет, — ответил второй. — Посмотри на разброс. У первого ученика видна стабильность, а у второго, похоже, есть проблемы: то единицы, то пятерки. Это может говорить о дисциплине или о том, что у него проблемы с учителем.
— Да, с точки зрения обучения это абсолютно два разных ученика, несмотря на одинаковую среднюю оценку.
Я думаю немного прояснилась проблема о средних.
К этим картинкам мы уже привыкли и смело опираясь на значения 4,5 звезд принимаем решение о выборе.
Для оценки надежности рейтинга (звездочек) товара с точки зрения статистики, можно использовать несколько методов. Один из наиболее распространенных методов — это вычисление взвешенного среднего рейтинга и стандартного отклонения. Давайте рассмотрим шаги для выполнения этих расчетов.
Сейчас будет немного математики, гуманитарии можете отмотать сразу к выводам
Какие у нас исходные данные?
Количество оценок - 70.
Пятерок - 51.
Четверок - 9.
Троек - 6.
Двоек - 2.
Единиц - 2.
Найдем среднее или среднее взвешенное. Оценки перемножим на их количество и сложим, а после разделим на количество оценок (70).
- (5х51)+(4х9)+(3х6)+(2х2)+(1х2)=315
315/70=4,5
Убедились сами, что средняя действительно 4,5. - Теперь вычислим стандартное отклонение. Это оценка на сколько данные отклоняются от среднего, помните про тех школьников? Это связано с мерой разброса данных.
5-4,5=0,5
4-4,5=-0,5
3-4,5=-1,5
2-4,5=-2,5
1-4,5=-3,5 - В статистике для корректного расчета нам необходимо избавиться от знака минус в полученных данных (0,5, -0,5, -1,5, -2,5, -3,5), поэтому возведем значения в КВАДРАТ (0,25, 0,25, 2,25, 6,25, 12,25). После, каждое значение умножим на количество оценок. Например: 2,25 (для тройки), 2,25х6=13,5. И так для каждой оценки. Опять их суммируем и разделим на 70 (наше количество оценок). Вычислим квадратный корень, так как ранее возводили в квадрат. Ура мы получили стандартное отклонение!
- Стандартное отклонение составляет примерно 0,97 (это в звездах), что указывает на относительно небольшой разброс рейтингов вокруг среднего значения.
- В статистике нельзя изучить все данные, потому что из тупо нет, поэтому мы экспериментируем на выборках, и в какой то степени им приходится доверять, как всегда не на 100 %. Для этого существует доверительный интервал с уровнем доверия 95% для среднего рейтинга товара.
Если вам важно понять что такое доверительный интервал пишите к комментариях
- Критическое значение из стандартного нормального распределения наших данных, для уровня доверия 95% равно примерно 1.96. Эти критерии уже давно апробированы и рассчитаны.
- Теперь найдем отклонение от среднего плюс-минус, в этом диапазоне может "плавать" наш рейтинг товара, как бы не совсем достоверна. Почему она может быть не достоверной? Все просто, не все проголосовали, статистика основана всего лишь на 70 оценках, а это так мало, ведь чем больше голосует чем точнее оценка.
- Умножим значение уровня доверия - 1,96 на стандартное отклонение - 0,97 и все это разделим на корень из 70 = 8,36 (наше количество оценок). 1,96х0,97/8,36 = 0,23. Это число характеризует, то что с 95% доверием оценка товара 4,5 (+/-) 0,23.
Вывод.
По нашим расчетам, исходя из всего лишь 70 оценок, пессимисты будут опираться на оценку 4,27, а оптимисты 4,73. Реалисты видят "коридор" оценки при средней 4,5 от 4,27 до 4,73.
Теперь про изменчивость "коридора". Представим, что проголосовавших стало на порядок больше. Пятерок - 510, четверок - 90, троек - 60, двоек - 20, единиц - 20, хотя доли от оценке к оценке не изменились. Коридор оценки изменился, при средней 4,5 от 4,42 до 4,57. Видите, "коридор" стал меньше, ближе к средней, средняя становится более честной.
Заключение.
Если при выборе товара вам важен рейтинг, то при прочих равных, вы знаете, что он точнее с большим количеством голосовавших.Мы можем быть уверены на 95%, что истинное среднее значение рейтинга товара находится в интервале от 4.27 до 4.73. Разброс достоверной оценки интересен в сравнении с другими товарами, а в абсолюте он дает представление о погрешности цифр рейтинга.