{"id":14262,"url":"\/distributions\/14262\/click?bit=1&hash=8ff33b918bfe3f5206b0198c93dd25bdafcdc76b2eaa61d9664863bd76247e56","title":"\u041f\u0440\u0435\u0434\u043b\u043e\u0436\u0438\u0442\u0435 \u041c\u043e\u0441\u043a\u0432\u0435 \u0438\u043d\u043d\u043e\u0432\u0430\u0446\u0438\u044e \u0438 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u0435 \u0434\u043e 1,5 \u043c\u043b\u043d \u0440\u0443\u0431\u043b\u0435\u0439","buttonText":"\u041f\u043e\u0434\u0440\u043e\u0431\u043d\u0435\u0435","imageUuid":"726c984a-5b07-5c75-81f7-6664571134e6"}

Статистика и никакого мошенничества

Часто сталкиваетесь с необходимостью визуализировать данные c помощью сводных таблиц и т.д.? А что если N число строк — это сухо и скучно? В этом случае необходима визуализация при помощи графиков и диаграмм. А что делать, если результаты гипотезы не совпадают с «ожиданием»? О том, как аудитору разобраться в фиктивной статистике читайте в нашей статье.

Сегодня 90% решений принимается на основе визуальных отчетов/презентаций и т.д. Вот тут на помощь и приходит познавательная статистика.

Начнем с самого простого примера, если наша задача состоит показать сравнительный анализ, предположим компаний А и Б по объему выручки.

Строим гистограмму:

Левый рисунок отражает самое простое построение и можно сказать: выручка компании Б больше в 2 раза чем у компании А, все верно, а теперь допустим, нам надо преподнести выручку компании Б в более выгодном свете, не в 2 раза больше, а в 3 и более. Для этого необходимо визуально «вытянуть» график и начинать ось не с 0, а допустим с 40. Готово! Большинство людей не смотрит на цифры, а смотрит красивую картинку.

Далее рассмотрим еще один графический пример в динамике.

Теперь нам надо проанализировать выручку за 4 года, рисуем график (левый) и получаем «вялую» линию. На первый взгляд есть рост, всё хорошо, но невыраженный. Тогда на помощь приходит ось не с 0 и масштабируемость. Теперь — яркий рост и все довольны, при этом цифры везде одинаковые.

Ещё один из приемов — ложная корреляция.

Возьмем актуальный на сегодняшний день пример: рост объема продаж туалетной бумаги коррелирует с количеством зараженных Covid-19. Сразу стоит кричать во весь мир: «Люди! Остановитесь! Туалетная бумага губит мир!».

Ложные корреляции встречаются повсеместно, даже там, где этого не делали с корыстной целью. Статистика не описывает причинно-следственных связей, поэтому, зачастую, корреляция является лишь плодом воображения, введением в заблуждение, ложной иллюзией наличия этой самой связи. Каждый раз видя два одинаково идущих графика, спрашивайте себя: «а может существует третий параметр, от которого зависят эти?» и тогда туалетная бумага, из нашего примера, останется в безопасности.

Настало время поделиться поистине «убийственным» инструментом маркетологов, который повсеместно используется. Парадокс Симпсона — эффект, явление в статистике, когда при наличии двух групп данных, в каждой из которых наблюдается одинаково направленная зависимость, при объединении этих групп направление зависимости меняется на противоположное.

Разберем ещё один пример: в экспериментальном тесте принимали участие 1710 мужчин и 900 женщин, с одним заболеванием, далее разбили группы, одни принимают лекарство, а другие плацебо (вещество без явных лечебных свойств, используемый для имитации лекарственного средства в исследованиях).

После курса лекарств, выходит интересный результат выздоровления пациентов:

Из всей людей, выздоровело 700 мужчин и 150 женщин принимавшие лекарство и 80 мужчин и 400 женщин, лечившихся плацебо. Смотрим долю (%) и видим для женщин и мужчин лекарство эффективное и стоит выпускать в массы, но не стоит спешить, если смотреть группу в целом (мужчин и женщин), то получаем противоположный результат. Теперь большая доля на стороне плацебо и получается, что лучше не принимать лекарство. Одним из решений данной проблемы является категорирование. При помощи данного парадокса можно «умело» трактовать данные в свою пользу.

Для аудита очень важно выявлять фиктивную статистику и изобличать ее, распознавать обман и фальсификацию данных, для этого нужно задать несколько вопросов: Откуда данные? Кто заинтересован? Чего не хватает? В этом есть смысл?

0
Комментарии
-3 комментариев
Раскрывать всегда