{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Пять основных диаграмм для визуализации данных. Шпаргалка для презентаций

Данная заметка станет экспресс-помощью всем, кто делает презентации и визуализирует данные. Она задумана как шпаргалка, сфокусируемся на пяти основных видах диаграмм и быстрых способах их выбора под задачу.

Цифры абстрактны, визуализация конкретна

Цифры сами по себе для нас абстрактны. А диаграмма позволяет преобразовать абстрактные цифры в визуальную, конкретную картинку, отражающую количество. Например, таблица даёт точное значение цифр, но утрачивает моментальность восприятия, которую даёт визуализация.

В основе визуализации данных всегда идея

Данные — это всего лишь данные. А чтобы они визуально заговорили, нужно определиться, о чём с помощью них мы хотим рассказать. Какой вывод сделать, какую идею (главную мысль) донести. С помощью одного и того же набора данных можно сказать о разном, положить в основу визуализации разные идеи.

Например, у нас есть набор данных по объёмам продаж разной продукции компании за несколько месяцев.

В основу идеи может быть положена определённая замеченная закономерность в данных. Анализируя итоговые показатели по продажам в таблице, мы можем заметить тенденцию роста объёма продаж. И тогда идею можно сформулировать следующим образом «С января объём продаж устойчиво рос». Отображаем идею на слайде визуально гистограммой и в докладе (выступлении) поясняем контекст идеи. Рост закономерен и обычен. Или у нас есть сезонность и весной должен быть спад продаж, а в этом году его нет и почему.

Анализируя продажи по месяцам, можно сформулировать другую идею «В мае продажи продукции А значительно превысили продажи продукции Б и В».

Поиску идеи стоит уделить время. Ведь сформулированную идею можно смело использовать в качестве заголовка слайда или заголовка диаграммы. Идея в качестве заголовка позволяет мгновенно считывать главную мысль визуализации (слайда). Сравните два варианта заголовка.

Для усиления идеи, можно расставить визуальные акценты

Вся фишка в сравнении

Визуальное восприятие человека так устроено, что сами по себе цифры для нас мало интересны и понятны. Чтобы цифры (данные) обрели смысл, их обязательно надо с чем-нибудь сравнить. Для донесения нашей идеи мы можем использовать пять основных типов сравнения: покомпонентное, позиционное, временное, частотное и корреляционное. И для каждого сравнения лучше подходит свой вид диаграммы.

                                                 Выделяем пять способов сравнения данных

Покомпонентное (долевое) сравнение

При таком сравнении мы показываем размер компонента в процентах от некоего целого. Целое обычно представляется в виде стандарта в 100%. При компонентном сравнении мы показывает долю от целого, поэтому его можно назвать и долевым сравнением. Круг у нас всегда ассоциируется с целым, поэтому для визуализации наиболее подходит круговая диаграмма.

Наши глаза не могут быстро определять количество объектов больше пяти. Секторов (долей) в диаграмме лучше не делать больше шести. Если значений больше, можно выделить пять основных, а остальные объединить в сектор “прочие”.

Мы привыкли по кругу двигаться по часовой стрелке. Самый важный компонент лучше располагать на линии 12-ти часов и обратить на него внимание выделив цветом. Если “важный” компонент выделять не надо, то сектора диаграммы лучше расположить от большего к меньшему. А цвет просто должен помогать чётко разделять сегменты.

Когда нужно сравнить компоненты (доли) нескольких целых, то лучше использовать гистограмму нормированную на 100%. В этом случае, самый важный показатель желательно размещать внизу.

Позиционное сравнение

Здесь важна позиция, которую объект занимает по отношению к другим объектам. На сколько он больше или меньше других объектов, какое место занимает в “строю” других объектов. Для позиционного сравнения лучше подходит линейчатая диаграмма

В линейчатой диаграмме по вертикали располагаются обозначения сравниваемых элементов, шкала располагается горизонтально. Саму шкалу можно не отображать, а значения подписывать у линеек диаграммы (как на рисунке выше).

Линейчатая диаграмма подходит для позиционного сравнения лучше чем гистограмма. Нашим глазам привычнее позицию воспринимать по вертикали (вверху — лучше, внизу — хуже). А ещё, при таком расположении оси обозначений, появляется больше места для записи названий показателей.

Временное сравнение

Используем, когда надо продемонстрировать, как показатели (данные) меняются во времени (динамика изменений). В визуальном восприятии мы привыкли воспринимать время слева (прошлое), направо (будущее). При временном сравнении для визуализации данных лучше подходит гистограмма.

Здесь тоже можно руководствоваться правилом “не больше пяти”. То есть, если на временной оси нужно показать более 5 значений (столбиков), возможно лучше использовать график. График однозначно нужно использовать вместо диаграммы, если значений больше семи, или нужно отобразить какие-то тренды.

Если на графике нужно отобразить изменение нескольких показателей, то лучше не использовать более трёх линий тренда. При нескольких линиях тренда, линию главного показателя выделяем цветом или толщиной.

Как и в случае с линейчатыми диаграммами, у гистограмм тоже есть множество разновидностей, за подробностями ныряйте в список литературы ниже.

Частотное сравнение

Частотное сравнение используем когда нужно отобразить частоту попадания числовых значений в некий диапазон (интервал). Такое сравнение удобно использовать, когда нужно обобщить (суммировать) большой объём информации, чтобы показать какую-то взаимосвязь. Для визуализации частотного сравнения хорошо подходят гистограммы и графики

Используются две шкалы. Вертикальная — шкала частотности и горизонтальная — шкала диапазонов. Для шкалы диапазонов важно правильно подобрать размер и количество диапазонов (интервалов).

Через малое количество интервалов бывает трудно проследить модель распределения, а слишком большое количество разбивает модель на мелкие части. В среднем, для лучшего визуального восприятия, можно рекомендовать количество интервалов от 5 до 10.

Размеры интервалов надо подбирать так, чтобы нагляднее показать идею (главную мысль).

Корреляционное сравнение

Корреляция — страшное и непонятное слово:) Такое сравнение используется, когда нам надо показать наличие или отсутствие связи (зависимости) между двумя переменными. Например, мы можем предположить, что чем больше скидку на товар мы даём тем больше этого товара продаём или чем опытней продавец, тем он больше продаёт.

Для такого типа сравнения лучше подходят точечные или двухсторонние линейчатые диаграммы.

В точечной диаграмме используются координатные оси исследуемых переменных. В координатах наносятся точки с числовыми значениями переменных. Расположение точек может указывать на какую-то зависимость. Или наоборот доказывать, что зависимости нет. Если зависимости нет, то в визуализации для понятности можно стрелкой показать, какая зависимость предполагалась

Если значений сравниваемых переменных не слишком много можно использовать линейчатые двухсторонние гистограммы. Если зависимость есть, то диаграмма получается зеркальной. Если зависимости нет, то и зеркального отображения нет.

Ещё можно использовать пузырьковые диаграммы. В таких диаграммах кроме переменных отмечаемых на осях, третьей переменной является размер (диаметр) пузырька.

Идея, пять сравнений и пять диаграмм

Итак, по шпаргалке нужно помнить, что можно выделить пять основных типов сравнения данных и пять типов диаграмм. И конечно не забывать про идею.

Шпаргалка сделана по книге Джин Желязны "Говори на языке диаграмм". С неё и нескольких других книг можно начать изучать эту тему глубже

Список литературы в формате минимализма 3+3

На русском:

На английском

Эдвард Тафти «Наглядное отображение количественной информации» — The Visual Display of Quantitative Information.

0
1 комментарий
Ирина Забегаева

Полезно, спасибо!

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда