{"id":14139,"url":"\/distributions\/14139\/click?bit=1&hash=00b24e988e1dc59bd4663b03b9a768598c65c83e190d2c3c54b8174356d44891","title":"100 000 000 \u0440\u0443\u0431\u043b\u0435\u0439 \u2014 \u043a\u0442\u043e \u043f\u043e\u043b\u0443\u0447\u0438\u0442 \u0441\u0442\u043e\u043b\u044c\u043a\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"5a117d4b-670b-5264-b1c5-3a5825131067"}

9 графиков, которые искажают данные

Нас повсюду окружают цифры: в новостях, социальных сетях, рекламе и на работе. Числовые данные привлекают наше внимание и выглядят более убедительно. Когда цифр становится слишком много и их уже сложно понять, используют графики. Они помогают быстрее увидеть нужную информацию и сделать выводы. Но графики могут лгать, если данные не проверены или некорректно визуализированы.

На простых примерах разберемся, почему такое происходит и как не обманывать себя и других.

(В статье графики и диаграммы используются как синонимичные понятия)

Почему могут врать данные?

  • Взята необъективная выборка для исследования. Участники из одной социальной группы, когда исследование этого не предполагает, или малое количество респондентов в выборке. Например, если в исследовании эффективности крема участвует 10 человек и у одного есть результат, это считается как 10%.
  • Неверно выбраны показатели. Самый распространенный пример — отличие в среднем значении и медиане. Если считать среднюю зарплату по стране, цифра окажется высокой, для этих целей нужно использовать медиану.
  • Не учтены третьи факторы и контекст. Например, сравнение ВВП и уровня загрязнения в развитых и развивающихся странах, потому что будут существенные отличия в промышленности этих стран.
  • Преувеличение или преуменьшение выводов. Например «образец является лучшим», а в цифрах разница между лучшим и худшим образцом незначительна и не играет никакой роли.

Альберто Кайро в книге «Графики лгут» советует: «Не верьте любой публикации, в которой нет прямого указания или ссылок на источник данных. Чтобы прочесть график, важно проверить, что именно в нем считают и как это делается».

Искажение данных в графиках

Чтобы замечать ошибки не обязательно изучать аналитику и статистику. Большинство графиков нам знакомы, они часто встречаются в интернете и на ТВ. Разберем примеры, когда график искажает данные.

1. Чрезмерный дизайн.

Оформление может искажать реальные пропорции диаграмм и усложнять понимание данных. Решение: уберите визуальные эффекты и цвета, которые не несут смысла.

2. Визуальное усечение.

Обрезана часть диаграммы, например, столбики в середине. Решение: покажите диаграмму в реальных пропорциях. Если некоторые значения слишком маленькие используйте рядом фрагмент с увеличенным масштабом этой области диаграммы.

3. Связь, которой нет.

На одной визуализации не связанные данные. Не экономьте места и не пытайтесь показать все на одном графике. На одном графике могут быть только взаимосвязанные данные, которые нужны для вывода.

4. Схемы, которые ведут к неверным выводам.

Здесь использована двойная ось Y, которая искажает реальное представление данных. Решение: используйте одни и те же плоскости для графиков и масштаб. Старайтесь не усложнять график, используйте одну ось Y.

5. Начинать не с начальной точки.

Альберто Кайро в книге «Графики лгут» пишет «я советую ставить 0 как начало в случае, если способ визуального кодирования данных — высота или длина. Если используется другой метод, то не обязательно начинать с 0».

В столбиковых диаграммах отсчет начинается с 0.

6. Искажение пропорций между осью абсцисс и ординат.

Например, нужно показать на графике рост 30%, это около ⅓. Решение: рисуем график, у которого длина примерно в 3 раза больше высоты.

7. Разные величины (тыс и млн, месяцев и лет и т.д).

На оси Y в первом случае динамика по годам, во втором — по месяцам. Решение: проверяйте все величины на этапе работы с данными.

8. Использование красного и зеленого цвета.

Это вносит дополнительный смысл. Решение: оставьте зеленый и красный для отображения минимальных и максимальных значений. Будьте аккуратны, если это фирменные цвета, при необходимости используйте дополнительные обозначения.

9. Неверный масштаб.

Пример: на первом рисунке пиктограмма численности Екатеринбурга больше пиктограммы Владимира в 16 раз, но в реальности численность больше в 4 раза. По ошибке увеличена не площадь круга, а его диаметр. При увеличении пиктограммы будет ошибкой увеличивать только ширину, высоту или диаметр. Решение: нужно увеличивать площадь.

Как читать сложные графики, если я не аналитик?

Можно сделать неверные выводы из-за невнимательности или даже увидеть то, что хотел увидеть (предвзятость подтверждения), поэтому ниже приведен алгоритм как читать график:

  1. Знакомство: заголовок, подзаголовок, источник
  2. Характеристики: что измеряется, оси и единицы измерения, легенда графика.
  3. Чтение графика: идея, поиск системы, тенденций, взаимосвязи.
  4. Выводы

Описание графика автором может идти до и после самого графика. Для начала лучше ознакомиться с графиком, чтобы научиться самостоятельно видеть взаимосвязи и делать выводы. А после находить подтверждение в словах автора или видеть свои ошибки. Исключением может быть автор, которому вы доверяете.

Графики помогают показать данные, находить ответы и делать выводы. Важно уметь их читать, видеть подозрительные графики и самостоятельно делать выводы.

Литература по теме

  • Альберто Кайро «Графики лгут. Как стать информационно грамотным человеком в мире данных?»
  • Хафф Дарелл «Как лгать при помощи статистики»
  • Джина Желязны «Говори на языке диаграмм»
  • Александр Богачев «Графики, которые убеждают всех»
  • Коул Нафлик «Данные: визуализируй, расскажи, используй: Сторителлинг в аналитике»

    Благодарность редактору — Арине Семчуговой
0
Комментарии
-3 комментариев
Раскрывать всегда
null