9 графиков, которые искажают данные

Скрыть данные с помощью убедительных графиков — легко! Фальсификация, пропаганда — без проблем! Графики несут в себе мощный информационный потенциал, но, также, они могут стать опасным инструментом, способным исказить информацию в нужных целях. Осторожно, возможно вы уже попались!)

Один недавний пример, получивший широкую огласку, связан с искажением данных в политике. В 2017 году президент США Дональд Трамп представил журналистам карту, которая показывала географическое распределение голосов на выборах президента в 2016 году и подтверждала его популярность среди избирателей. Она украшала стены кабинетов Белого дома, карту публиковали СМИ, а писатель Jack Posobiec поставил ее на обложку своей книги «Граждане за Трампа: инсайдерская история о том, как народ вернул себе Америку».

@TreyYingst
@TreyYingst

Однако карта была разработана таким образом, чтобы искажать данные. Она создавала впечатление об однозначной поддержке Дональда Трампа и преобладании его партии, хотя это не соответствовало действительности. Такое представление было медиа-манипуляцией: искажение графика служило политическим целям, направленным на пропаганду и формирование определенного образа.

Примеров искажения графиков, связанных с политикой и медиа-манипуляциями, достаточно много. Эта тема популярна среди западных писателей. Но стоит добавить, что это не всегда связано с умышленным искажением, проблемы могут возникать на этапе сбора и анализа данных, а также визуальной подготовки материалов, когда дизайнер решает сделать «красиво».

На простых примерах разберемся, почему такое происходит и как не обманывать себя и других.

(В статье графики и диаграммы используются как синонимичные понятия)

Почему могут врать данные?

  • Взята необъективная выборка для исследования. Участники из одной социальной группы, когда исследование этого не предполагает, или малое количество респондентов в выборке. Например, если в исследовании эффективности крема участвует 10 человек и у одного есть результат, это считается как 10%.
  • Неверно выбраны показатели. Самый распространенный пример — отличие в среднем значении и медиане. Если считать среднюю зарплату по стране, цифра окажется высокой, для этих целей нужно использовать медиану.
  • Не учтены третьи факторы и контекст. Например, сравнение ВВП и уровня загрязнения в развитых и развивающихся странах, потому что будут существенные отличия в промышленности этих стран.
  • Преувеличение или преуменьшение выводов. Например «образец является лучшим», а в цифрах разница между лучшим и худшим образцом незначительна и не играет никакой роли.

Альберто Кайро в книге «Графики лгут» советует: «Не верьте любой публикации, в которой нет прямого указания или ссылок на источник данных. Чтобы прочесть график, важно проверить, что именно в нем считают и как это делается».

Искажение данных в графиках

1. Чрезмерный дизайн

Оформление может искажать реальные пропорции диаграмм и усложнять понимание данных. Решение: уберите визуальные эффекты и цвета, которые не несут смысла.

9 графиков, которые искажают данные

2. Визуальное усечение

Обрезана часть диаграммы, например, столбики в середине. Решение: покажите диаграмму в реальных пропорциях. Если некоторые значения слишком маленькие используйте рядом фрагмент с увеличенным масштабом этой области диаграммы.

9 графиков, которые искажают данные

3. Связь, которой нет

На одной визуализации не связанные данные. Не экономьте места и не пытайтесь показать все на одном графике. На одном графике могут быть только взаимосвязанные данные, которые нужны для вывода.

9 графиков, которые искажают данные

4. Схемы, которые ведут к неверным выводам

Здесь использована двойная ось Y, которая искажает реальное представление данных. Решение: используйте одни и те же плоскости для графиков и масштаб. Старайтесь не усложнять график, используйте одну ось Y.

9 графиков, которые искажают данные

5. Начинать не с начальной точки

Альберто Кайро в книге «Графики лгут» пишет «я советую ставить 0 как начало в случае, если способ визуального кодирования данных — высота или длина. Если используется другой метод, то не обязательно начинать с 0».

В столбиковых диаграммах отсчет начинается с 0.

9 графиков, которые искажают данные

6. Искажение пропорций между осью абсцисс и ординат

Например, нужно показать на графике рост 30%, это около ⅓. Решение: рисуем график, у которого длина примерно в 3 раза больше высоты.

9 графиков, которые искажают данные

7. Разные величины (тыс и млн, месяцев и лет и т.д)

На оси Y в первом случае динамика по годам, во втором — по месяцам. Решение: проверяйте все величины на этапе работы с данными.

9 графиков, которые искажают данные

8. Использование красного и зеленого цвета

Это вносит дополнительный смысл. Решение: оставьте зеленый и красный для отображения минимальных и максимальных значений. Будьте аккуратны, если это фирменные цвета, при необходимости используйте дополнительные обозначения.

9 графиков, которые искажают данные

9. Неверный масштаб

Пример: на первом рисунке пиктограмма численности Екатеринбурга больше пиктограммы Владимира в 16 раз, но в реальности численность больше в 4 раза. По ошибке увеличена не площадь круга, а его диаметр. При увеличении пиктограммы будет ошибкой увеличивать только ширину, высоту или диаметр. Решение: нужно увеличивать площадь.

9 графиков, которые искажают данные

Графики помогают показать данные, находить ответы и делать выводы. А также могут искажать эти данные, вводить в заблуждение, влиять на мнения и восприятие событий общественностью. Поэтому важно уметь читать графики и самостоятельно делать выводы.

Литература по теме

  • Альберто Кайро «Графики лгут. Как стать информационно грамотным человеком в мире данных?»
  • Хафф Дарелл «Как лгать при помощи статистики»
  • Джина Желязны «Говори на языке диаграмм»
  • Александр Богачев «Графики, которые убеждают всех»
  • Коул Нафлик «Данные: визуализируй, расскажи, используй: Сторителлинг в аналитике»

    Благодарность редактору — Арине Семчуговой
44
Начать дискуссию