{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Статистика и никакого мошенничества

Часто сталкиваетесь с необходимостью визуализировать данные c помощью сводных таблиц и т.д.? А что если N число строк — это сухо и скучно? В этом случае необходима визуализация при помощи графиков и диаграмм. А что делать, если результаты гипотезы не совпадают с «ожиданием»? О том, как аудитору разобраться в фиктивной статистике читайте в нашей статье.

Сегодня 90% решений принимается на основе визуальных отчетов/презентаций и т.д. Вот тут на помощь и приходит познавательная статистика.

Начнем с самого простого примера, если наша задача состоит показать сравнительный анализ, предположим компаний А и Б по объему выручки.

Строим гистограмму:

Левый рисунок отражает самое простое построение и можно сказать: выручка компании Б больше в 2 раза чем у компании А, все верно, а теперь допустим, нам надо преподнести выручку компании Б в более выгодном свете, не в 2 раза больше, а в 3 и более. Для этого необходимо визуально «вытянуть» график и начинать ось не с 0, а допустим с 40. Готово! Большинство людей не смотрит на цифры, а смотрит красивую картинку.

Далее рассмотрим еще один графический пример в динамике.

Теперь нам надо проанализировать выручку за 4 года, рисуем график (левый) и получаем «вялую» линию. На первый взгляд есть рост, всё хорошо, но невыраженный. Тогда на помощь приходит ось не с 0 и масштабируемость. Теперь — яркий рост и все довольны, при этом цифры везде одинаковые.

Ещё один из приемов — ложная корреляция.

Возьмем актуальный на сегодняшний день пример: рост объема продаж туалетной бумаги коррелирует с количеством зараженных Covid-19. Сразу стоит кричать во весь мир: «Люди! Остановитесь! Туалетная бумага губит мир!».

Ложные корреляции встречаются повсеместно, даже там, где этого не делали с корыстной целью. Статистика не описывает причинно-следственных связей, поэтому, зачастую, корреляция является лишь плодом воображения, введением в заблуждение, ложной иллюзией наличия этой самой связи. Каждый раз видя два одинаково идущих графика, спрашивайте себя: «а может существует третий параметр, от которого зависят эти?» и тогда туалетная бумага, из нашего примера, останется в безопасности.

Настало время поделиться поистине «убийственным» инструментом маркетологов, который повсеместно используется. Парадокс Симпсона — эффект, явление в статистике, когда при наличии двух групп данных, в каждой из которых наблюдается одинаково направленная зависимость, при объединении этих групп направление зависимости меняется на противоположное.

Разберем ещё один пример: в экспериментальном тесте принимали участие 1710 мужчин и 900 женщин, с одним заболеванием, далее разбили группы, одни принимают лекарство, а другие плацебо (вещество без явных лечебных свойств, используемый для имитации лекарственного средства в исследованиях).

После курса лекарств, выходит интересный результат выздоровления пациентов:

Из всей людей, выздоровело 700 мужчин и 150 женщин принимавшие лекарство и 80 мужчин и 400 женщин, лечившихся плацебо. Смотрим долю (%) и видим для женщин и мужчин лекарство эффективное и стоит выпускать в массы, но не стоит спешить, если смотреть группу в целом (мужчин и женщин), то получаем противоположный результат. Теперь большая доля на стороне плацебо и получается, что лучше не принимать лекарство. Одним из решений данной проблемы является категорирование. При помощи данного парадокса можно «умело» трактовать данные в свою пользу.

Для аудита очень важно выявлять фиктивную статистику и изобличать ее, распознавать обман и фальсификацию данных, для этого нужно задать несколько вопросов: Откуда данные? Кто заинтересован? Чего не хватает? В этом есть смысл?

0
Комментарии
-3 комментариев
Раскрывать всегда