Логическая модель влияния на рейтинг заведения в картах

Логическая модель влияния на рейтинг заведения в картах

Привет, VC! На связи Женя Smarty.

Последние несколько лет я с головой погружен в мир данных и аналитики, особенно в то, как они влияют на решения в бизнесе и нашу повседневную жизнь в этом безумном мире технологий и цифры. Сегодня я хочу затронуть тему, которая касается каждого из нас, кто хоть раз выбирал/продвигал/запускал ресторан, отель или сервис, опираясь на пользовательские отзывы и рейтинги. Речь пойдет о том, как формируется общий рейтинг на Яндекс.Картах, и почему я решил копнуть именно в эту сторону.

Для меня это не просто технический челлендж. Это попытка разобраться, как из миллионов разрозненных мнений складывается одна, казалось бы, простая цифра. Как система учитывает не только оценку, но и качество отзыва – его объем, наличие фотографий, видео? Влияет ли количество упоминаний того или иного аспекта (например, "еда", "атмосфера", "сервис") на итоговую оценку? И главное – можно ли, поняв эти механизмы, улучшить свой продукт или сервис, зная, что именно ценит аудитория?

Эта тема захватила меня своей неопределенностью и значимостью. Яндекс не раскрывает точные алгоритмы, и это создает поле для гипотез, экспериментов и глубокого анализа. Я верю, что понимание этих "скрытых" формул может дать бизнесу мощный инструмент для роста и адаптации.

Формула влияния аспекта на общий рейтинг

Предлагаемая формула для расчета "взвешенного" рейтинга аспекта, который затем может быть агрегирован для получения общего рейтинга:

Логическая модель влияния на рейтинг заведения в картах

Где:

● Rаспект - Взвешенный рейтинг конкретного аспекта (например, "Еда", "Атмосфера", "Музыка").
● N - Общее количество отзывов, упоминающих данный аспект.
● i - Индекс отдельного отзыва, затрагивающего данный аспект.
● Si - Оценка удовлетворенности для i-го отзыва (1, если отзыв положительный/рекомендующий аспект, 0, если отрицательный/не рекомендующий). В вашем случае это соответствует процентному соотношению "пальцев вверх" к "пальцам вниз".
● wi - Весовой коэффициент i-го отзыва, зависящий от его формата:
wi=1 для отзывов без текста
● wi=1.1 для отзывов с текстом
● wi=1.2 для отзывов с текстом и фото
● wi=1.3 для отзывов с текстом и несколькими фото или видео

Описание формулы и ее применение:

1. Определение Si (Оценка удовлетворенности): В моих данных, Si уже агрегирована в процентное соотношение. Например, для "Еды", 81% "пальцев вверх" означает, что 81% отзывов были положительными по этому аспекту. Чтобы использовать это в формуле, мы можем рассматривать Si как "1" (положительный) для доли положительных отзывов и "0" (отрицательный) для доли отрицательных отзывов.

2. Расчет Rаспект (Взвешенный рейтинг аспекта):

● Для каждого аспекта мы берем количество положительных и отрицательных отзывов.

● Каждому отзыву присваивается весовой коэффициент wi в зависимости от его формата (текст, фото и т.д.).

● Суммируются взвешенные положительные оценки и делятся на сумму всех весовых коэффициентов для этого аспекта.

Пример применения для аспекта "Еда":

Допустим, у нас есть 238 отзывов по "Еде". Из них 81% положительные и 19% отрицательные.

Представим, что эти 238 отзывов распределены по форматам (это гипотетический пример, так как у нас нет данных по распределению форматов):

● 100 отзывов без текста (коэффициент 1)

● 80 отзывов с текстом (коэффициент 1.1)

● 40 отзывов с текстом и фото (коэффициент 1.2)

● 18 отзывов с текстом и видео (коэффициент 1.3)

Сначала нужно понять, сколько из этих отзывов были положительными/отрицательными.

Если 81% положительные, то 238×0.81≈193 положительных отзыва.

Если 19% отрицательные, то 238×0.19≈45 отрицательных отзывов.

Теперь, чтобы применить формулу, мы бы умножили долю положительных отзывов в каждой категории на их соответствующий коэффициент и просуммировали.

Однако, поскольку у нас уже даны агрегированные проценты "пальцев вверх", более реалистичный подход к использованию нашей формулы для расчета общего рейтинга будет следующим:

Агрегация для Общего Рейтинга

Для расчета общего рейтинга 4.8 на Яндекс.Картах, необходимо агрегировать взвешенные рейтинги всех аспектов. Это сложнее, так как неизвестно, как Яндекс определяет вес каждого аспекта в общем рейтинге. Возможно, они используют:

  • Количество упоминаний: Аспекты, которые упоминаются чаще (например, "Еда" с 238 отзывами), имеют больший вес.
  • Категория заведения: Для ресторана "Еда" и "Атмосфера" могут быть более важными, чем "Музыка".

Яндекс может использовать машинное обучение для определения значимости каждого аспекта на основе пользовательских предпочтений и общего поведения.

Мой сугубо личный статистический анализ
Предлагаемая модель для Общего Рейтинга (гипотетическая)
Предлагаемая модель для Общего Рейтинга (гипотетическая)

Где:

● Rобщий - Общий рейтинг заведения (например, 4.8).

● M - Общее количество рассматриваемых аспектов.

● Rаспектj - Взвешенный рейтинг j-го аспекта, рассчитанный по формуле выше (с учетом Si как процента положительных отзывов).

● Cj - Коэффициент важности аспекта (это неизвестная переменная, которую Яндекс определяет сам).

Nаспектj - Количество отзывов, упоминающих j-й аспект.

Как использовать наши данные для оценки влияния:

Наши данные (процент положительных отзывов и количество отзывов для каждого аспекта) уже позволяют увидеть "взвешенное" качество каждого аспекта.

Например, для "Еды":

● 81% положительных оценок из 238 отзывов.

● Для "Атмосферы": 96% положительных оценок из 167 отзывов.

Можно предположить, что Яндекс берет эти процентные показатели и умножает на некий весовой коэффициент, который зависит от количества отзывов и, возможно, от типа формата отзыва.

Задача с использованием моих данных и коэффициентов:

Нужно рассчитать "взвешенный процент положительных оценок" для каждого аспекта.

Пример для "Еды": Если бы мы знали распределение 238 отзывов по форматам (без текста, с текстом и т.д.), мы могли бы более точно применить коэффициенты. Однако, поскольку у меня есть только агрегированные данные (81% положительных), мы можем интерпретировать это так:

81% из 238 отзывов по "Еде" имеют оценку "палец вверх" (позитив), 19% - "палец вниз" (негатив).

Если не учитывать распределение форматов внутри этих 81% и 19%, то наиболее простой способ интегрировать коэффициенты - это применить их к общему количеству отзывов, а не к каждому отдельному отзыву.

■ Упрощенный подход:

Количество "позитивных" отзывов по "Еде" = 238×0.81=192.78≈193.

Количество "негативных" отзывов по "Еде" = 238×0.19=45.22≈45.

Допустим, средний коэффициент для всех 238 отзывов по "Еде" равен Kсредний_еда. Тогда "взвешенный" показатель будет 0.81×Kсредний_еда.

Однако, вопрос предполагает, что переменная с коэффициентом формата отзыва заложена в расчет.

Формула для расчета влияния аспекта на общий рейтинг, учитывая коэффициенты формата отзыва (без точного распределения отзывов по форматам):

Поскольку у нас нет данных о том, сколько из этих 238 отзывов по "Еде" были "без текста", "с текстом" и т.д., невозможно применить коэффициенты wi к каждому отдельному отзыву. Вместо этого, можно предложить следующую интерпретацию, если бы мы имели эти данные:

Предположим, для каждого аспекта, например "Еда", мы знаем количество положительных и отрицательных отзывов для каждого формата.

● Nпоз,текст = количество положительных отзывов с текстом

● Nнег,текст = количество отрицательных отзывов с текстом

● Nпоз,фото = количество положительных отзывов с фото

● ... и так далее для всех форматов.

Тогда для аспекта "Еда":

Где Nобщ,формат - общее количество отзывов данного формата по аспекту (положительные + отрицательные)
Где Nобщ,формат - общее количество отзывов данного формата по аспекту (положительные + отрицательные)

Поскольку у нас нет распределения по форматам для каждого аспекта, мы можем использовать усредненный коэффициент для каждого аспекта, если предположить, что распределение форматов внутри положительных и отрицательных отзывов примерно одинаково, или что у нас есть некое общее распределение форматов отзывов для всего заведения.

Пример с усредненным коэффициентом:

Если у нас есть общее распределение всех отзывов заведения по форматам (например, 30% без текста, 40% с текстом, 20% с фото, 10% с видео), мы можем рассчитать средний коэффициент Kсредний:

Kсредний=(0.3×1)+(0.4×1.1)+(0.2×1.2)+(0.1×1.3)=0.3+0.44+0.24+0.13=1.11

Тогда для каждого аспекта мы можем умножить процент положительных оценок на этот Kсредний:

Влияние аспекта на общий рейтинг (с усредненным коэффициентом):

Логическая модель влияния на рейтинг заведения в картах

Где:

● Влияниеаспект - Показатель, отражающий вклад аспекта в общий рейтинг.

● %Положительныхаспект - Процент положительных оценок для аспекта (например, 0.81 для "Еды").

● Kсредний - Усредненный весовой коэффициент отзыва по форматам (рассчитывается на основе общего распределения отзывов).

● Nаспект - Количество отзывов, упоминающих аспект.

Чем выше этот показатель, тем больше аспект "тянет" общий рейтинг заведения вверх.

Это не точная формула Яндекса, но логическая модель, позволяющая интегрировать ваши вводные данные. Яндекс, скорее всего, использует более сложные статистические модели и машинное обучение для определения важности каждого аспекта и агрегации их в общий рейтинг.

Но по опыту точно могу сказать, если вы увеличиваете количество упоминаний в отзывах того или иного аспекта, то рейтинг растет пропорционально средневзвешенному коэффициенту в зависимости от количества отзывов по тому или иному аспекту и выводит ваше заведение в поиске экосистем релевантно облаку семантики вокруг аспекта.

Всем спасибо за внимание! Развивайте свой бизнес и процветайте.

Усы Маркетолога
"WOW маркетинг - это не маркетинг. Это пиар самого PR специалиста. Миром правят цифры."
63
1
1
2 комментария