9 графиков, которые искажают данные
Нас повсюду окружают цифры: в новостях, социальных сетях, рекламе и на работе. Числовые данные привлекают наше внимание и выглядят более убедительно. Когда цифр становится слишком много и их уже сложно понять, используют графики. Они помогают быстрее увидеть нужную информацию и сделать выводы. Но графики могут лгать, если данные не проверены или некорректно визуализированы.
На простых примерах разберемся, почему такое происходит и как не обманывать себя и других.
(В статье графики и диаграммы используются как синонимичные понятия)
Почему могут врать данные?
- Взята необъективная выборка для исследования. Участники из одной социальной группы, когда исследование этого не предполагает, или малое количество респондентов в выборке. Например, если в исследовании эффективности крема участвует 10 человек и у одного есть результат, это считается как 10%.
- Неверно выбраны показатели. Самый распространенный пример — отличие в среднем значении и медиане. Если считать среднюю зарплату по стране, цифра окажется высокой, для этих целей нужно использовать медиану.
- Не учтены третьи факторы и контекст. Например, сравнение ВВП и уровня загрязнения в развитых и развивающихся странах, потому что будут существенные отличия в промышленности этих стран.
- Преувеличение или преуменьшение выводов. Например «образец является лучшим», а в цифрах разница между лучшим и худшим образцом незначительна и не играет никакой роли.
Альберто Кайро в книге «Графики лгут» советует: «Не верьте любой публикации, в которой нет прямого указания или ссылок на источник данных. Чтобы прочесть график, важно проверить, что именно в нем считают и как это делается».
Искажение данных в графиках
Чтобы замечать ошибки не обязательно изучать аналитику и статистику. Большинство графиков нам знакомы, они часто встречаются в интернете и на ТВ. Разберем примеры, когда график искажает данные.
1. Чрезмерный дизайн.
Оформление может искажать реальные пропорции диаграмм и усложнять понимание данных. Решение: уберите визуальные эффекты и цвета, которые не несут смысла.
2. Визуальное усечение.
Обрезана часть диаграммы, например, столбики в середине. Решение: покажите диаграмму в реальных пропорциях. Если некоторые значения слишком маленькие используйте рядом фрагмент с увеличенным масштабом этой области диаграммы.
3. Связь, которой нет.
На одной визуализации не связанные данные. Не экономьте места и не пытайтесь показать все на одном графике. На одном графике могут быть только взаимосвязанные данные, которые нужны для вывода.
4. Схемы, которые ведут к неверным выводам.
Здесь использована двойная ось Y, которая искажает реальное представление данных. Решение: используйте одни и те же плоскости для графиков и масштаб. Старайтесь не усложнять график, используйте одну ось Y.
5. Начинать не с начальной точки.
Альберто Кайро в книге «Графики лгут» пишет «я советую ставить 0 как начало в случае, если способ визуального кодирования данных — высота или длина. Если используется другой метод, то не обязательно начинать с 0».
В столбиковых диаграммах отсчет начинается с 0.
6. Искажение пропорций между осью абсцисс и ординат.
Например, нужно показать на графике рост 30%, это около ⅓. Решение: рисуем график, у которого длина примерно в 3 раза больше высоты.
7. Разные величины (тыс и млн, месяцев и лет и т.д).
На оси Y в первом случае динамика по годам, во втором — по месяцам. Решение: проверяйте все величины на этапе работы с данными.
8. Использование красного и зеленого цвета.
Это вносит дополнительный смысл. Решение: оставьте зеленый и красный для отображения минимальных и максимальных значений. Будьте аккуратны, если это фирменные цвета, при необходимости используйте дополнительные обозначения.
9. Неверный масштаб.
Пример: на первом рисунке пиктограмма численности Екатеринбурга больше пиктограммы Владимира в 16 раз, но в реальности численность больше в 4 раза. По ошибке увеличена не площадь круга, а его диаметр. При увеличении пиктограммы будет ошибкой увеличивать только ширину, высоту или диаметр. Решение: нужно увеличивать площадь.
Как читать сложные графики, если я не аналитик?
Можно сделать неверные выводы из-за невнимательности или даже увидеть то, что хотел увидеть (предвзятость подтверждения), поэтому ниже приведен алгоритм как читать график:
- Знакомство: заголовок, подзаголовок, источник
- Характеристики: что измеряется, оси и единицы измерения, легенда графика.
- Чтение графика: идея, поиск системы, тенденций, взаимосвязи.
- Выводы
Описание графика автором может идти до и после самого графика. Для начала лучше ознакомиться с графиком, чтобы научиться самостоятельно видеть взаимосвязи и делать выводы. А после находить подтверждение в словах автора или видеть свои ошибки. Исключением может быть автор, которому вы доверяете.
Графики помогают показать данные, находить ответы и делать выводы. Важно уметь их читать, видеть подозрительные графики и самостоятельно делать выводы.
Литература по теме
- Альберто Кайро «Графики лгут. Как стать информационно грамотным человеком в мире данных?»
- Хафф Дарелл «Как лгать при помощи статистики»
- Джина Желязны «Говори на языке диаграмм»
- Александр Богачев «Графики, которые убеждают всех»
- Коул Нафлик «Данные: визуализируй, расскажи, используй: Сторителлинг в аналитике»
Благодарность редактору — Арине Семчуговой