Особенности национального потребления шаурмы. Статистический анализ. Часть 1

Давно с друзьями и коллегами обсуждал возможность проведения статистического исследования потребителей и точек продажи шаурмы на основании анализа отзывов в тематических приложениях. Наконец-то, появилось время. Итак, представляю широкому кругу читателей нижеследующий аналитический материал.

В закладки

I. Кратко о методологии исследования

Цели и задачи: (1) провести сравнительный лингвистический анализ частоты использования слов "Шаурма" и "Шаверма" в различных населённых пунктах; (2) определить факторы, влияющие на высокую либо низкую оценку точек продажи; (3) определить населённые пункты с высокими и низкими потребительскими оценками точек продажи шаурмы; (4) сравнить цены на шаурму в различных населённых пунктах и сопоставить их с местными зарплатами; (5) по аналогии с индексом "Биг-Мага" сформировать индекс "Шаурмы", т.е. оценить количество порций шаурмы, которые может купить житель населенного пункта со средней зарплатой.

Данные для анализа: отзывы потребителей и данные о точках продаж из приложения, входящего в топ-3 крупнейших тематических приложений о шаурме.

География исследования: Россия, Беларусь, Казахстан, Украина.

Выборка исследования: 72 500 отзывов, 7 645 точек продажи шаурмы.

Инструменты для сбора и анализа данных:

  • пакеты python: (1) requests - для сбора данных, (2) json_normalize, ElementTree - для разбора json и xml результатов сбора данных, (3) pandas - для формирования первичного массива (датафрейма), (4) pymorphy2 и nltk - для стемминга и нормализации текста отзывов, (5) collocations - для формирования биграмм и выявления ключевых словосочетаний в отзывах

  • MS Excel для статистического анализа и визуализации данных
  • IBM SPSS для статистического анализа там, где он удобнее, чем MS Excel

II. Сравнительный лингвистический анализ частоты использования слов "шаурма" и "шаверма"

Используемые слова

Чаще всего потребители именуют продукт словом "шаурма" (35% отзывов), на втором месте по популярности слово "шаверма" (29%), далее следуют сокращённые производные слова "шава" (24%) и "шавуха" (10%).

А как Вы чаще всего называете данный продукт?
Шаурма
Шаверма
Шава
Шавуха
Другое (укажите в комментариях)
Показать результаты
Переголосовать
Проголосовать

Слово "шаурма"

Чаще всего слово "шаурма" используется в городах Центрального, Южного и Приволжского федеральных округов России. Особенно часто слово "шаурма" используют пользователи из Ростова-на-Дону (74%), Орла (70%), Самары (70%), г. Щелково (68%), г. Пушкино (67%) и Краснодара (65%).

Слово "шаверма"

Термин "шаверма" популярен среди жителей Северо-Западного федерального округа России. Чаще других его используют пользователи в Петергофе (72%), Великом Новгороде (71%) и Пушкине (70%).

Сравнение Москвы и Санкт-Петербурга

В Москве слово "шаурма" используется в 49% отзывов, "шаверма" - в 10%.
В Санкт-Петербурге слово "шаурма" - только в 3% отзывов, а "шаверма" в 61%.

Слово "шава"

Сокращённое производное слово "шава" не имеет чётко выраженной региональной привязки. Чаще других в своих отзывах его применяют пользователи из населённых пунктов: Реутов (45%), Тверь (40%), Новокузнецк (40%), Мурино (40%), Сергиев Посад (38%), Шушары (37%), Калуга (36%) и Минск (35%).

III. Факторы, влияющие на оценку продукта и точки продажи

Кратко о системе оценки

Анализируемый сервис предлагает оценить точку и её продукт по трем характеристикам: (1) "Вкус продукта", (2) "Сытность продукта" и (3) "Атмосфера заведения". Каждая характеристика оценивается пользователем по шкале от 0 до 10 баллов. Далее вычисляется среднее значение всех отзывов и переводится в рейтинг от 0 до 100 баллов. Например, если есть 2 отзыва о "Вкусе продукта" - 5 баллов и 8 баллов, то средняя оценка составит 6,5 баллов. Тогда рейтинг точки по критерию "Вкус продукта" составит 6,5*10 = 65 баллов из 100.

Процедура отбора факторов

Факторы, влияющие на оценку точки и её продукта, отобраны в базу данных исследования по двум направлениям:

  1. Анализируемый сервис содержит информацию о точке: "наличие веганского меню", "наличие туалета", "продажа пива", "возможность безналичной оплаты" (полагаю, что перевод на карту "Сбербанка" или "на телефон" здесь также подразумевается).

  2. Был произведен семантический разбор отзывов, выделены и сгруппированы по схожему смыслу словосочетания, которые взаимосвязаны с оценкой пользователей и присутствуют не менее, чем в 100 отзывах.

Итоговый список факторов

  • Формализованные приложением: "наличие веганского меню", "наличие туалета", "продажа пива" и "возможность безналичной оплаты"

  • По итогам анализа отзывов: (1) положительные: "сочная шаурма", "шаурма не течёт", "шаурма не разваливается", "сотрудники в перчатках", "хрустящий лаваш", "свежие продукты", "мясо жарят на углях", "быстро готовят", "много мяса", "вкусный соус"; (2) отрицательные: "не свежие продукты", "много капусты", "сухая шаурма", "мало мяса", "сотрудники без перчаток", "мало соуса".

Влияние факторов, формализованных приложением

  • Более половины точек продажи шаурмы (56%) предлагают возможность безналичной оплаты (картой либо переводом). В случае наличия такой опции пользовательский рейтинг "атмосферности" точки будет выше на +5 баллов из 100.
  • Пиво продаётся в каждой четвёртой точке (27%). Опция также положительно влияет на пользовательские оценки (+5 баллов к рейтингу "атмосферности").
  • 23% точек предлагают меню для веганцев. (+6 баллов из 100).
  • Туалет есть только в каждой 5-ой точке продажи (22%). Стоит отметить, что опция наиболее важна среди вышеперечисленных для потребителей (+7 баллов в случае её наличия).

Безналичная оплата шаурмы в региональном срезе

Лучше всего опция безналичной оплаты шаурмы представлена в точках продаж таких городов, как Якутск (96% точек), Сургут (95%), Томск (95%), Петрозаводск (90%), Пермь (89%) и Тюмень (88%).

Сложнее всего оплатить уличную шаурму безналичным способом в таких городах, как Киев (только 4% точек принимают данную форму оплаты), Владивосток (13%), Пенза (25%) и Тверь (26%).

Влияние факторов, выделенных на основании анализа отзывов пользователей

В целом, следует отметить, что наличие определённых позитивных / негативных факторов, влияет на общую готовность пользователей поставить более высокую / низкую оценку точке и продукту. По одним факторам это выражено в большей степени, по другим - в меньшей.
Проще говоря, если пользователь доволен / не доволен значимым фактором, то он наверняка одновременно поставит более высокую / низкую оценку и "вкусу", и "сытности", и "атмосфере".

Положительные факторы в отзывах

Потребители значительно выше оценивают точки продажи, в которых продаётся "сочная шаурма" (+20 баллов из 100 по критерию "вкус", +16 к "сытности" и +18 к "атмосфере").

Одновременно, качественная шаурма должна быть приготовлена таким образом, чтобы "из нее ничего не вытекало" (+15 ко "вкусу", +14 к "сытности" и +13 к "атмосфере") и сама она "не разваливалась (+15 ко "вкусу", +13 к "сытности" и +14 к "атмосфере").

Также следует отметить, что соблюдение базовых принципов гигиены положительно влияет на оценку пользователей. Если потребитель видит, что сотрудник "готовит продукт в перчатках", то оценка такой точки выше (+12 ко "вкусу", +9 к "сытности" и +11 к "атмосфере").

С распределением влияния других положительных факторов можно ознакомиться на диаграмме ниже.

Отрицательные факторы в отзывах

Больше всего негативных эмоций у потребителей вызывают несвежие продукты в составе шаурмы, что критически влияет на низкую оценку точки продажи (-39 баллов ко "вкусу" шаурмы, -30 к "сытности" и -33 к "атмосфере" заведения).

На втором месте по негативу - большое количество капусты в составе продукта (-31 ко "вкусу", -25 к "сытности" и -25 к "атмосфере").

На третьем месте - слишком сухая шаурма (-34 ко "вкусу", -22 к "сытности" и -21 к "атмосфере).

С распределением других отрицательных факторов можно ознакомиться на диаграмме ниже.

А что Вам больше всего не нравится в уличной шаурме?
Несвежие продукты
Много капусты
Сухая шаурма
Мало мяса
Сотрудники без перчаток
Мало соуса
Много овощей
Не покупаю уличную шаурму
Другое (укажите в комментариях)
Показать результаты
Переголосовать
Проголосовать

Продолжение следует... (из него вы узнаете: (1) в каких городах самая и невкусная шаурма; (2) где самая дешёвая, а где самая дорогая шаурма; (3) сколько порций шаурмы могут позволить себе жители различных городов постсоветского пространства)

Материал опубликован пользователем. Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Сергей Егоров", "author_type": "self", "tags": [], "comments": 22, "likes": 17, "favorites": 9, "is_advertisement": false, "subsite_label": "marketing", "id": 77526, "is_wide": false, "is_ugc": true, "date": "Wed, 31 Jul 2019 14:19:02 +0300" }
{ "id": 77526, "author_id": 336183, "diff_limit": 1000, "urls": {"diff":"\/comments\/77526\/get","add":"\/comments\/77526\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/77526"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199113, "last_count_and_date": null }
22 комментария

Популярные

По порядку

Написать комментарий...
2

Батон, парадная, шаверма, небес асфальтный тусклый цвет ...

Ответить
3

аж гречу захотелось!

Ответить
2

Не нравится в уличной шаурме, когда на этой вывеске вместо слова "шаверма" написано "шаурма".
Важное замечание: такую нетерпимость проявляю только в Питере.

Ответить
1

Годный контент, теперь давайте про фалафель!

Ответить
0

Есть пара претензий к исследованию:
1) В визуализации запроса "Шаверма" нет смысла разделять Пушкин, Петергоф, Кудрово, Деревня Кудрово, Шушары, Мурино, Колпино, Парголово и Санкт-Петербург. Это всё-таки можно сказать один город, да и выборка была бы более репрезентативной, наверняка в Петергофе (живу там) не так много точек продаж, и соответственно отзывов. Я бы агрегировал их все в Питер, как город, и дальше сравнивал с Калининградом, Мурманском, и т.д. (возможно лучше бы подошла тепловая карта, кстати есть бесплатный сервис для этого удобный https://app.datawrapper.de)

2) Анализ городов по безналичной оплате: это просто манипулирование данными. 16 точек больше 15, 200 точек тоже больше 15. Но если в условном Якутске 15 точек с безналичной оплатой из 16, а в Питере 140 из 200, то отсюда не следует, что в Питере больше проблем с безнальной оплатой. Показывать только долю неправлильно, хотя бы в скобках стоит указать абсолютное количество точек с безналичной оплатой. Уверен, что если бы выборка была по всему общепиту в этих городах, то порядок бы городов изменился, и в топ вошли бы более оснащённые терминалами города (скорее всего в топ вышли крупные по населению города).

P.s. А вот с запросом "Шава" интересно: получается пригороды, причём относительно бедные СПб говорят и шаверма, и более гопническое "Шава"

Ответить
1

1. Пожелание по объединению учту. За карту большое спасибо, именно такой сервис искал.
2. Смотрите, мы говорим только про точки продажи шаурмы. Поэтому сопоставлять с общепитом в целом не очень хорошо. Да, 16 точек это немного, но у нас тут не выборочное наблюдение по точкам, а практически сплошное. Предлагаю использовать долю и в скобках указывать общее количество точек.
3. С "Шавой" действительно характерно для пригородов.

Ответить
0

а про Нижний Новгород не написали(

Ответить
0

Учту. В дальнейшем в отдельной публикации выложу статистику по всем городам, но уже без текста.

Ответить
0

В статье упомянуто, но явно не написано - шаурму обязательно надо потреблять с пивом! Идеально сочетается, гасит несвежесть продуктов, гасит луковый перегарчик и так далее.

Самая шикарная вещь, которую начисто в основном игнорируют - картошка фри в шаурме.

Самая говенная шаурма - в столице. Шанс попасть на полное фуфло крайне высокий.

Ответить
0

Вот это полезная статья. Вот это я понимаю. Shaurma bless mother Russia!

Ответить
0

Спасибо!

Ответить
0

Ну наконец-то кто-то додумался сделать "самый популярный" анализ малого бизнеса России и стран СНГ !
Предприниматели! Перенимайте опыт топикстартера! Больше анализов малого бизнеса !
Ваших цифр ждут молодые диванные стартаперы и хипстеры со смузи!

Ответить
0

Отгружаю лайки! Наконец-то исследование, которого мы достойны. Не хватает еще данных по расположению точки в городе, если конечно такую информацию можно получить и связать.

Ответить
0

Уточните, какую аналитику по расположению точек в городе Вы хотели бы увидеть в исследовании? Данные о lattitude/longitude точек у меня есть.

Ответить
0

Шава: Ваши ожидания - Ваши проблемы. С)

Ответить
0

Почему статья называется статистическим анализом, а в самом тексте только куча круговых и линейных диаграмм описывающих доли?
Про то, что автор даже понятие доли не знает я вообще молчу.

Ответить
0

1. Конкретизируйте, что конкретно Вам не понравилось с т.з. статистического анализа? Отсутствие статистических критериев значимости, согласия и др.? Я полагаю, в рамках данного исследования материал станет слишком перегруженным. Это исследование не для вака, скопуса, ринц. Это описательное исследование с данными, ориентированными на широкий круг лиц из разных сфер. Посмотрите любой публичный пресс-релиз / отчет крупных социологических организаций: ВЦИОМ, ФОМ, Левада, ГФК и т.д. - везде описательная статистика, понятная для всех.
2. Круговая диаграмма только одна, а не куча. Если в целом говорить об улучшении инструментов визуализации, то замечание уже было получено от Никиты Иванова - в дальнейшем учту.
3. Поясните, что не так с долями?

Ответить
0

Лол, для маркетолухов критерий значимости уже офигеть какой рокетсаенс и статья в скопус, а не то, чем должен владеть каждый из них.

Ответить
0

Я Вас понял.
Спасибо за интерес к моему материалу =)

Ответить
0

Я бы сказал не интерес, а просьба не использовать такие громкие заголовки, когда решил просто в бесплатном веб-редакторе порисовать графики для курсовой в ПТУ.

Ответить
0

Шаварма.

Ответить
0

Свиток!

Ответить
0
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } } ]
Нейронная сеть научилась читать стихи
голосом Пастернака и смотреть в окно на осень
Подписаться на push-уведомления
{ "page_type": "default" }