Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Согласно исследованию «Data Age 2025», проведенному аналитической компанией IDC (International Data Corporation), объем данных в мире к 2025 году вырастет до 175 зеттабайт (175 триллионов ГБ). Большую часть этих данных генерирует бизнес.

Это огромное количество информации, которое включает в себя данные о клиентах, транзакциях, конкурентах, процессах и операциях, данные из социальных сетей и онлайн-платформ, сенсоров, IoT и многие другие. Все они представлены в разных форматах: электронных таблицах, текстах, изображениях, видео.

Анализ данных - мощный инструмент для принятия обоснованных и эффективных решений в бизнесе, но интерпретация данных в исходном виде может быть сложной:

  • Большие объемы данных перегружают информацией, рост идет быстрее, чем их успевают обрабатывать
  • Данные хранятся в корпоративных источниках с установленной системой доступов, что ограничивает свободу работы с ними
  • Переключение между разными форматами затрудняет восприятие информации
  • Для полноты картины необходим контекст и связи между разрозненными данными
  • Не вся информация одинаково ценна для анализа, выделить ключевую вручную сложно
  • Анализ часто требует специализированных навыков и инструментов, математические модели и алгоритмы не интуитивны для большинства людей
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Для того чтобы данные были понятны даже для неподготовленного человека, их можно представить в виде визуализаций: графиков, диаграмм, таблиц, карт.

В статье рассказываем, как создавать эффективные визуализации:

  • как выбрать диаграмму, которая раскроет природу данных и поможет выявить скрытые в них закономерности
  • какие цвета использовать в дизайне визуализаций, чтобы подчеркнуть ключевые показатели

Что такое хорошая визуализация?

Согласно исследованиям Калифорнийского университета в области вербального и невербального общения зрительное восприятие информации обычно составляет около 90%.

Правильно подобранные визуальные образы воспринимаются более однозначно, чем текст, что делает визуализации ключевыми для понимания и запоминания информации.

Хорошая визуализация учитывает особенности данных, на которых она строится, чтобы сделать принятие бизнес-решений максимально наглядным и интуитивным.

Путем использования различных цветов, форм и размеров, визуализация поможет выделить ключевую информацию, что упрощает ее анализ.

Если вы корректно используете визуализации:

  • Большой объем данных преобразовывается в лаконичную, доступную для всех форму
  • Графики и диаграммы вызывают интерес, их хочется изучать и задавать вопросы
  • Данные представлены в соответствии с основной целью визуализации и потребностями пользователей, которые их исследуют
  • В данных возникают связи и формируется новый смысл
  • Информация становится живой, даже если тема сама по себе сложна для восприятия

Обратите внимание на примеры ниже. На обоих из них - информация о 7560 спутниках, которые в настоящее время вращаются вокруг Земли.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.ucsusa.org%2Fresources%2Fsatellite-database&postId=1185253" rel="nofollow noreferrer noopener" target="_blank">Отчет в Excel</a> пугает и вызывает желание его закрыть, данные кажутся скучными
Отчет в Excel пугает и вызывает желание его закрыть, данные кажутся скучными
<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fgeoxc-apps.bd.esri.com%2Fspace%2Fsatellite-explorer%2F&postId=1185253" rel="nofollow noreferrer noopener" target="_blank">Дашборд в виде глобуса</a> впечатляет, его хочется рассматривать и изучать
Дашборд в виде глобуса впечатляет, его хочется рассматривать и изучать

Как создать хорошие визуализации?

Для того, чтобы создать визуализацию, которая привлечет внимание пользователя и облегчит анализ, стоит придерживаться ряда рекомендаций:

  • Выбрать диаграмму, правильно отображающую конкретный тип данных
  • Использовать цвета так, чтобы они помогали пользователю быстрее оценить ключевые показатели
  • Расставить акценты в формах, размерах, с помощью насыщенности цветов, которые подчеркнут самое важное
  • Выбрать такой дизайн визуализаций, который не будет препятствовать пониманию связи в данных или искажать их

Ниже разберем каждую из рекомендаций подробнее.

Выбирайте диаграмму в соответствии с задачей

Визуализации создаются не просто для красоты, как правило, у каждого набора данных существует минимум 2–3 варианта визуализации для ответа на разные бизнес-запросы.

Графики и диаграммы помогают быстро обозначить ключевые тренды или аномалии. Таблицы используются для точного отображения конкретных числовых значений.

Самая известная схема выбора визуализаций (чарт-чузер) была предложена еще в 2006 году Эндрю В. Абела, создателем методики разработки презентаций Extreme Presentation™ Method.

Она основана на разделении диаграмм по видам анализа (сравнение, распределение, соотношение, структура), количеству категорий, переменных и периодов.

Помимо схемы Абела существуют и другие чарт-чузеры, которые могут быть хорошей подсказкой для выбора подходящей визуализации.

Рассмотрим некоторые типы диаграмм по основным категориям, которые чаще всего используются для визуализации данных.

1
Сравнение

Сходство и различие между переменными в один момент времени. Например, сравнение результатов маркетинговых кампаний, план-факт продаж.

  • Линейчатая диаграмма (Bar Chart)
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Также известна как столбчатая или полосчатая диаграмма, отображающая информацию в виде баров (столбцов). Длина столбца – значение параметра.

  • Линейчатая диаграмма с группировкой
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Используется для сравнения двух или нескольких наборов данных. Каждый набор данных выделен своим цветом.

  • Вертикальная диаграмма Водопад (Waterfall)
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Используется для отображения изменений значения относительно предыдущего. Верхний – исходное значение, нижний – итоговое.

  • Лолипоп
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Значение параметра отображено длиной линий, на верхушке каждой добавлен кружок. Вид диаграммы позволяет добавлять сноски и пояснения.

2
Распределение

Деление на категории, частотность в пределах интервала, группировка по признаку. Например, распределение населения по возрастам, продаж по регионам, процентное соотношение успешных и провальных событий.

  • Гистограмма
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Визуализирует распределение данных в рамках непрерывного интервала или ограниченного периода времени.

  • Боксплот
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Также известна как Диаграмма размаха, «ящик с усами». Показывает статистические показатели: медиану, верхний и нижний квартили, минимумы и максимумы, выбросы.

  • Точечная карта
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Известна также, как точечная карта плотности распределения. Отображает географические паттерны или распределение данных по географическим регионам.

  • График плотности
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Демонстрирует распределение данных за непрерывный или определенный интервал времени. Отображает более гладкое распределение за счет сглаживания изменений параметров.

3
Структура

Соотношение части к целому, состав, деление категорий на подкатегории и их отношение к общей величине. Например, доля филиалов в общей выручке, влияние увеличения продаж и сокращения расходов на рост прибыли.

  • Круговая диаграмма (Pie chart)
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Отражает соотношение категорий к целому при помощи сегментов окружности. Вся окружность означает общую сумму, 100%.

  • Линейчатая диаграмма с накоплением
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Показывает, как крупная категория делится на более мелкие, и какое отношение имеет каждая часть в рамках общей величины.

  • Горизонтальная диаграмма Водопад (Waterfall)
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Показывает процентное соотношение подкатегорий и общего показателя, изменение частей от целого во времени.

  • Древовидная карта (Treemap)
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Отображает иерархические данные, полезна при необходимости визуализировать большие объемы данных.

4
Корреляция

Взаимосвязь между переменными, которую можно описать как "когда изменяется переменная X, изменяется и переменная Y ". Например, сегментация клиентов по частоте обращений, возрасту и покупательской способности.

  • Пузырьковая диаграмма
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Отображает трехмерные данные в двумерном пространстве. Размер каждого пузырька является третьим измерением.

  • Диаграмма рассеяния
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Демонстрирует, существуют ли связи между двумя переменными. Степень взаимосвязи определяется плотностью расположения точек.

  • Зеркальная линейчатая диаграмма
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Два набора данных располагаются по разным сторонам оси для удобства сравнения и поиска взаимосвязей.

  • Тепловая карта
Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Визуализирует данные в цветовой гамме. Удобна для демонстрации вариативности переменных, выявления паттернов, отображения взаимосвязей между переменными.

Правильно выбранная визуализация помогает представить данные более понятно и наглядно, обнаружить скрытые тренды или аномалии в данных.

Правильно используйте цвета

Цветовая палитра для визуализаций способна как помочь пользователю быстрее оценить ключевые показатели, так и создать хаос в данных.

Например, использование слишком ярких и насыщенных цветов может создать визуальный шум и отвлечь от самой информации. В то же время, слишком блеклые оттенки сливаются друг с другом и не позволят сконцентрироваться на разнице показателей.

Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Рассказываем о нескольких приемах использования цвета, которые помогут сделать ваши визуализации лучше:

1
Цветовая палитра зависит от типа данных

Существует три основных типа цветовых палитр для визуализаций: категориальная (качественная), последовательная и расходящаяся.

Категориальная (качественная) палитра

Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Палитра состоит из разных цветов, которые не имеют упорядоченного или градиентного значения, с близкой яркостью и насыщенностью.

Категориальная цветовая палитра предназначена для представления категорий или классов данных без какого-либо внутреннего порядка или значений между категориями.

Она используется для отображения дискретных категорий, таких как различные группы товаров, типы событий, категории пользователей и т. д.

Последовательная палитра

Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Градиент из одного цвета разной насыщенности.

Палитру используют для данных, где присутствует упорядоченная структура, явная прогрессия или различные уровни значений.

Например, такая палитра идеально подходит для отображения температурных карт, рейтингов, показателей продаж, или любых данных, которые имеют явное распределение от низких к высоким значениям или наоборот.

Расходящаяся палитра

Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Комбинация последовательных палитр с разрывом, диапазон значений с определенной серединой, от которой цвета уходят в разные направления.

Расходящаяся палитра подходит для визуализации данных, которые имеют явное различие между низкими и высокими значениями, с выделенной областью средних значений или уровнем концентрации.

Это может быть полезно при отображении данных о средней температуре, статистике доходов или других показателях, где центральное значение играет важную роль.

Выбор цветовой палитры также зависит от контекста визуализации и эстетических предпочтений. Например, для корпоративных отчетов можно использовать цвета, соответствующие фирменному стилю.

2
Чем меньше цветов, тем проще найти их на дашборде

Для создания визуализаций лучше использовать не больше 5–6 цветов. Диаграмма будет выглядеть более профессионально, если использовать в ней только несколько оттенков и комплементарных цветов.

Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Во избежание хаоса в цветах рекомендуется стандартизировать несколько цветовых палитр, каждая из которых предназначена для определенных целей: несколько темных цветов, несколько светлых и нейтральные оттенки.

В случаях, когда необходимо использовать большее количество цветов, лучше заменить их оттенками серого или объединить несколько не ключевых категорий данных в одну.

3
Разные цвета для разных диаграмм

Пастельные, ненасыщенные цвета лучше подходят для крупных элементов визуализации. Яркие, насыщенные – для мелких, в том числе, надписей, тонких линий.

Для корректного отображения маленьких элементов можно или прибавить насыщенность и яркость цветовой палитры в конкретной диаграмме, или попробовать увеличить масштаб элементов/ сделать линии толще.

Как правильно визуализировать данные, чтобы принимать эффективные решения? Часть 1

Для компонентов таблиц и графиков, не относящихся к данным, стоит использовать нейтральные цвета, довольно контрастные, но, в то же время, не отвлекающие от данных.

Для обозначения осей и границ диаграмм лучше использовать тонкие, насыщенные серые линии, для фона универсальный вариант – белый.

4
Не знаете, какой цвет выбрать - используйте красный и синий

Лиза Шарлотта Мут, руководитель отдела коммуникаций издания Datawrapper, в одной из статей о лучших практиках визуализации, предлагает цвета, которые чаще всего используют дизайнеры визуализаций: оттенки желтого/оранжевого/красного в сочетании с оттенками синего.

Эти цвета универсальны для любых видов данных и подходят под любые тематики.

Желтый, оранжевый и красный сочетаются, но, при этом, воспринимаются как разные цвета, что необходимо для отображения разных значений. Синий цвет всегда воспринимается приятно и даже профессионально.

Примеры визуализаций из отчета "A year in Graphic detail" от The Economist
Примеры визуализаций из отчета "A year in Graphic detail" от The Economist

К тому же контраст этих цветов доступен даже тем, кто страдает дальтонизмом и другими особенностями восприятия.

Итак, в первой части статьи мы узнали, что для создания эффективных визуализаций важно:

  • Подобрать диаграмму, которая поможет наиболее полно представить конкретные данные и отследить тенденции
  • Корректно использовать палитры цветов и помнить, что первичная задача - наглядная демонстрация, а не яркий дизайн

Как подчеркнуть самое важное?

Во второй части статьи про эффективные визуализации данных расскажем о том, как расставлять акценты с помощью цветов, форм, масштабов, чтобы помочь пользователю сконцентрироваться на ключевых показателях.

Следите за нашими обновлениями!

Qlever Solutions – компания-эксперт в области внедрения корпоративных систем бизнес-аналитики. Более 10 лет мы создаем наглядные дашборды для подразделений маркетинга, продаж, закупок, финансового отдела и топ-менеджмента.

Отраслевой опыт, накопленный нами на протяжении работы над проектами для ритейла, фудритейла, промышленности, строительства, энергетики, помогает нам создавать визуализации, отвечающие уникальным потребностям бизнеса.

Хотите создать визуализации, которые помогут вам принимать эффективные решения?

Свяжитесь с нами, и мы разработаем эстетичные и наглядные дашборды для детального анализа ключевых KPI вашего бизнеса.

ХОЧУ КРАСИВЫЙ ДАШБОРД

Начать дискуссию