Визуализация данных - почему это важный шаг в работе с данными
Процесс визуализации позволяет приблизиться к пониманию структуры и контекста данных в результате анализа как для аналитиков, так и для бизнес-заказчиков. При работе с данными визуализация может пригодиться на 2-х разных стадиях
- Исследование данных
- Разработка BI решения для бизнеса и презентация результатов анализа
Первый вариант менее чувствителен к разным правилам, т.к. обычно его используют специалисты для себя или для узкого числа коллег, чтобы понять данные, с которыми предстоит работать. Data Science специалисты и аналитики данных могут пользоваться различными Python библиотеками для визуализации данных в процессе EDA (Exploratory Data Analysis): matplotlib, seaborn, pyplot. Во втором варианте при разработке BI-решения нам важно сконцентрироваться на нашем конечном пользователе, значит нам важно сделать визуализацию данных понятной и полезной в первую очередь для него.
Почему важно визуализировать результаты анализа:
- визуальная информация усваивается человеком быстрей и лучше
- это понятный способ восприятия данных для бизнес-заказчиков
- большие объемы данных можно показать только визуальными элементами
- есть возможность подсветить главные метрики
- выделить паттерны или группы в данных с помощью цвета, размера, формы
- возможность размещения на одном экране большого количества метрик и KPI (дашборд)
У человека есть принципы восприятия визуального контента, которых придерживаются UI/UX-дизайнеры, BI-разработчики. Можно прочитать хорошую статью про Гештальт принципы
Также есть несколько способов выделять необходимые элементы на визуализации с помощью:
- цвета
- размера
- положения
- формы
- типа линий
- фона
Правила хорошей визуализации данных
- Правильно подбирать тип визуального элемента
В зависимости от данных и их контекста можно подбирать разные графики, диаграммы, которые лучшим образом смогут описать природу данных. Например, для изменения величины во времени лучше использовать график, а для отображения категорий товаров - горизонтальную столбчатую диаграмму или круговую диаграмму. - Минимизировать количество визуальных элементов
Важно не перегрузить экран дашборда, иначе он будет плохо читаться, На одном экране можно располагать 4-6 визуальных элементов с фильтрами - Логическое расположение элементов
Человек привык читать информацию слева-направо и сверху-вниз как книгу. Поэтому сверху принято располагать главные KPI и метрики, на которые стоит обращать внимание в первую очередь. Фильтры обычно располагаются в столбец справа, либо сверху над всеми метриками.
- Упрощать максимально дизайн элементов, следить за форматом подписей легенд, категорий и осей
Минималистичный дизайн проще всего читается, не отвлекая внимание на излишние эффекты (тени, рамки графиков, 3D-графики) - Визуализация должна помогать решать поставленную бизнес-задачу и делать выводы или решения на основе анализа данных
При проектировании и разработке дашбордов важно помнить, что они нужны нашим заказчикам для решения определенной цели с прописанными use-кейсами. Важно понимать, как ваши пользователи будут взаимодействовать с дашбордом, чтобы решить свою потребность и задачу.
Еще больше практической информации по работе с данными, BI, Data Science и бизнес-анализу публикуется в Telegram канале Data Study