Продолжение истории уже в подписке на Кинопоиске
Продолжение истории уже в подписке на Кинопоиске
Условия подписки: clck.ru/rfS2r
16+
Далее автопродление — 299 ₽/мес. Предложение до 31.07.2022 г. Подробнее: clck.ru/rfS2r
Личный опыт
Yandex Cloud

Как инженер-аналитик из Петербурга протестировал сервисы визуализации данных, рисуя комиксы

В Yandex.Cloud мы развививаем сервис для анализа и визуализации данных DataLens. Недавно мы нашли проект Eolay's Gallery, где инструмент представили в виде персонажа из комикса. Инженер-программист и бизнес-аналитик Наташа Киселева поделилась с нами опытом работы в Microsoft Power BI, Python, Tableau и рисунками.

Как я познакомилась с датавизом

Первым датавиз-инструментом, с которым я столкнулась, стал Tableau. Это было в 2017 году. Я попробовала построить в нем пару графиков, ничего не поняла и оставила его до лучших времен. Через год прошла марафон DataYoga по работе с Tableau, и тогда этот инструмент меня впечатлил. Примерно в то же время зарождалось международное сообщество визуализации данных Data Visualization Society — я присоединилась, и это тоже помогло развить навыки работы с данными.

Я люблю систематизировать знания и, все больше погружаясь в Tableau, а затем в Power BI, начала рисовать свои первые датавиз-комиксы. Они были образовательные: про правила визуализации и особенности разных диаграмм.

Затем появилась серия для «Клуба анонимных аналитиков», аналитического сообщества на Facebook.

Я постила все комиксы на своих страничках в Facebook и «ВКонтакте», а что-то выкладывала в группы сообществ.

Как датавиз превратил меня из инженера-программиста в аналитика

Я пришла в датавиз из разработки, и сначала визуализация была лишь вспомогательной частью моей работы на руководящей должности. Как заместителю директора в энергетической компании мне приходилось собирать статистику по разным отделам и делать презентации. Для этого я строила диаграммы в Power BI, таблицы в Excel, налаживала простенькие самообновляемые дашборды на JavaScript с данными о состоянии текущих проектов и разработке документации. Например, с информацией о применении типовых решений, числе проектов, объемах документации и количестве сборочных единиц по месяцам.

Дашборд по проектам Системы автоматизированного проектирования

Еще был дашборд на JavaScript для руководителей сборочного производства, который помогал оценить, готов ли проект к сборке.

Со временем мне захотелось сосредоточиться на работе с отчетностью, автоматизацией и визуализацией, и я перешла на позицию главного специалиста. Кроме того, я начала работать в Институте бизнес-аналитики Алексея Колоколова. Там я веду курсы по датавизу, а также делаю дашборды для заказчиков в Power BI и Tableau.

Чем дольше я работала с инструментами визуализации, тем больше чувствовала, что у каждого их них свой «характер» — это я и постаралась отразить в своей серии персонажей-инструментов. Их внешний вид сложился из моего восприятия продуктов, их свойств и функций, а также корпоративных цветов и логотипов. А еще персонажи разных рас — дайверсити было важно, так как я ориентировалась и на международную аудиторию.

Кто есть кто

Tableau — красивая, милая девочка, не чуждая прекрасному. Это мой первый датавиз-инструмент, так что к нему особенно теплые чувства.

Я преподавала курс по работе с Tableau в Институте бизнес-аналитики и участвовала в челленджах Makeover Monday — там большая галерея, в которой можно подсмотреть интересные решения и прокачаться. Сейчас редко использую Tableau в работе: делаю в нем проекты для себя или какие-то срочные задачи по визуализации.

В отличие от блочных инструментов, где есть готовые примитивы, — Power BI, QlikView, Flourish — в Tableau можно сотворить очень красивый и необычный график, который захочется распечатать и повесить на стену, потому что получится настоящий дата-арт.

Есть бесплатная облачная версия Tableau Public. Вы работаете на компьютере, но результат сохраняется в общее облако, и если покопаться в галерее на сайте Tableau Public — можно найти много интересного. В рамках «Viz of the Day» там выкладывают подборки красивых инфографик и дашбордов. Некоторые из них можно скачать и посмотреть, как они устроены. Это очень помогает, поскольку красивые редкие диаграммы иногда непросто сделать.

Один из проектов, которые я делала в Tableau, — радарные диаграммы по «Игре престолов». Еще в юности я встретила в компьютерной игре радарную диаграмму, описывающую характеристики персонажей. Она показалась мне забавной. Много лет спустя я прочитала статью, где HR использовали такую для описания навыков сотрудников. Я пробовала внедрить эту идею в своей компании. Если в диаграмме мало углов, а названия навыков короткие — смотрится неплохо. Но учитывая, что навыков обычно больше шести и названия у них длинные, такая диаграмма больше смущает, чем помогает. К тому же не все программные средства позволяют настроить диаграмму так, чтобы в ней было удобно работать. Я все еще люблю радарные паутинки: они красивые и применимы в некоторых узких сферах. Изначально мой макет «Игры престолов» был лаконичным, но потом я сделала в Tableau более пестрый вариант. Даже разделила персонажей на выдуманные команды, чтобы показать возможности применения радаров. Но все же вынуждена признать, что это далеко не самый удобный вид визуализации, хоть и выглядит эффектно.

В этом программном пакете есть свой язык Calculations. Он позволяет вычислять различные переменные и KPI: брать сдвиги по годам, сравнивать план с фактическими цифрами и так далее.

Из минусов — сервис не переведен на русский, что повышает порог входа, и в бесплатную версию входит мало инструментов для работы с данными. Создание базовых бизнес-диаграмм тоже может быть затруднительно. Например, чтобы построить водопад, придется поучиться на YouTube. Сделать обычную карточку тоже не так уж легко.

Microsoft Power BI — деловой парень, энергичный менеджер и при этом золотой мальчик как наследник империи Microsoft. Он про бизнес, поэтому одет в рубашку с галстуком.

Один из основных инструментов, которые я использую для создания дашбордов. Я училась работать с ним в Институте бизнес-аналитики, а потом сама выступала преподавателем.

Это добротный продукт Microsoft. Диаграммы в нем, конечно, получаются лучше, чем в Excel, но у него есть некая Excel-подобность: дано около десяти базовых графиков, а если хотите сделать что-то особенное — нужно либо строить график в сложном инструменте Charticulator, либо искать его во внешних приложениях — даже если такой найдется, при использовании может лагать. То есть, с одной стороны, можно легко создать диаграмму и ничего в ней не настраивать, но с другой — свободы творчества иногда не хватает: не всегда даже есть возможность контролировать шрифты. Еще дашборд подвисает, когда в нем больше десяти листов, но эту проблему можно решить, просто создав несколько файлов.

Интерактивный дашборд с данными о проектах и объемах документации, обновляемый напрямую из базы данных. Так я использую его в своей работе. А для заказчика создаю PDF-документ, чтобы его можно было использовать в презентациях. Тут нет подсвеченных цветом отклонений, характерных для динамических дашбордов.

Дашборд по инвестициям. С незнакомой темой работать всегда труднее, но и интереснее. Проект состоял всего из одного дашборда, но заставил помаяться, так как не все задумки было легко реализовать в Power BI.

SMM-статистика. Этот проект я делала для себя — чтобы наблюдать за сообществом «Клуб анонимных аналитиков» и ориентироваться в контенте, так как там очень много полезных постов о визуализации данных.

У бесплатной версии Power BI широкий набор функций. Работая в облаке, можно сохранять файлы на компьютер и публиковать дашборды в общий доступ. Кто не хочет делиться результатами — работает в личном кабинете на сайте. Еще в бесплатную версию входит отличный механизм Power Query, который позволяет вращать и очищать данные. В Tableau аналогичный инструмент доступен только в платной версии.

В Power BI два языка: функциональный язык запросов DAX (Data Analysis Expression) — его логика схожа с логикой языка в Tableau — и язык M внутри Power Query, на котором можно не просто вычислять формулы, а объединять источники данных, чистить их, убирать ошибки, фильтровать. Для большинства операций не обязательно знать язык М — очень удобно, что эта функциональность доступна и через меню.

Я собиралась остановиться на паре персонажей, но друзьям и сообществу они так понравились, что решила рисовать новых: языки программирования, которые используют при визуализации, и другие инструменты.

Python — простой, немного гиковатый парень. Символы на его на футболке — пасхалки к «Монти Пайтон» и «Автостопом по галактике». Он про комьюнити, «особость» и свою атмосферу.

Python может применяться для обработки данных и создания графиков. Для визуализации в нем есть несколько библиотек: Matplotlib, Seaborn, Ggplot, Bokeh, Plotly и другие. Возможно, их функциональность не позволит с легкостью создать интерактивный шедевр дата-арта, но вы точно сможете построить нужные графики для анализа данных с помощью нескольких строчек кода.

Также этот язык совершенно прекрасен, когда нужно что-то быстро автоматизировать или обработать, потому что он простой и удобный.

JavaScript D3 — загадочный красавец-программист с хвостиком и в свитере. Очень умный и уверенный, так как знает, что на порядок круче других.

Красивые интерактивные визуализации часто созданы на JavaScript. У этого языка несколько библиотек для визуализации данных. D3 — самая сложная, но в ней самые классные инструменты. Работа с D3 не интуитивно понятна, при этом обучающих материалов в интернете мало. Поэтому советую сначала попробовать другие библиотеки JavaScript: возможно, их будет достаточно для ваших задач. Например, с графиками и диаграммами хорошо справляются Chart.js и Plotly.js.

Я изучала D3, чтобы создавать красивые и удобные генеалогические деревья. Но когда дело дошло до дашбордов — отказалась от него в пользу библиотеки Chart.js, которая позволила мне сделать простой HTML-файл с дашбордом, обновляемым с помощью скрипта. Любой пользователь мог открыть его по внутренней ссылке и посмотреть текущее состояние показателей по отделу. Конечно, в Tableau или Power BI создавать дашборды удобнее и проще, но BI-инструменты не везде применимы.

Excel — богач и СЕО крупной корпорации, повидавший всякое. Он многое умеет, уверен в себе, но не всегда поспевает за молодежью. Power BI, кстати, его внучок.

Инструменты визуализации в Excel ограничены, но и в нем можно сделать хорошую диаграмму или даже красивый, информативный, легко обновляемый дашборд. Функциональности Excel достаточно для оформления корпоративной отчетности, но, конечно, в плане работы с данными он отстает от своего родственника Power BI.

В Excel я строила стандартные графики для презентаций, расчета статистики, сбора и хранения данных, обработки и очистки данных с помощью макросов. Помимо этого пробовала делать в нем дашборды — это были мои первые работы, яркие и простые. Сейчас я многое бы в них изменила, но по-прежнему считаю, что в этом продукте можно легко рисовать очень достойные дашборды. На одном листе вбиваете данные, второй лист тут же обновляется — можно сделать скриншот или выгрузить PDF, и регулярный отчет готов. Это прекрасный вариант для тех, кому не подходят BI-системы и языки программирования.

Один из моих ранних дашбордов. Рисовала его, чтобы руководителю группы было проще собирать отчетность.

Yandex DataLens — энергичная северянка в модных зимних сапожках. Модные — потому что продукт молодой, а зимние — потому что российский. Красно-белая футболка с эмблемой досталась от Яндекса. Подписчики уже дали ей имя — Лена.

Это бесплатный облачный инструмент для разработки графиков и дашбордов внутри Yandex.Cloud. У него простой интерфейс, для начала работы не нужно приобретать лицензию, плюс к сервису легко подключиться. Я изучала этот инструмент в рамках марафона DataYoga. Загрузка данных интуитивно понятна, удобно работать с мерами, вычислениями, диаграммами и дашбордами. Готовыми дашбордами легко поделиться.

Сильная сторона Yandex DataLens — бесшовная интеграция с внешними датасетами, например, данными о погоде, ЖКХ, магазинах и ресторанах, которые обновляются в режиме реального времени. Эти функции делают инструмент удобным для бизнеса и социальных проектов. Надеюсь, список датасетов будет пополняться.

Чтобы подгрузить аналогичные данные в других продуктах, надо знать, где взять ресурсы и как сделать коннекторы, — если инструмент вообще позволяет такую интеграцию.

Наглядная статистика в DataLens помогает определить, где самый высокий спрос на продукт или услугу и открывать там новые точки продаж. «Додо Пицца» с помощью DataLens выбрала, где открывать новые рестораны, а маркетплейс KazanExpress — где больше всего нужны пункты выдачи.

Персонажи долго путешествовали по чатам и соцсетям, но меня всё чаще спрашивали, где можно посмотреть все в одном месте. Так год назад я создала сайт, на котором собрала разные серии датавиз-комиксов.

Погрузившись в среду датавиза, восхищалась красотой некоторых работ и так увлеклась дата-артом. Это такой вид визуализации, когда проект на основе данных настолько красив, что его можно принять за произведение искусства и повесить на стену. Я делаю собственные дата-арт-проекты, веду канал по дата-арту вместе со специалистом по визуализации данных Александром Богачевым и недавно запустила канал с дата-комиксами. Если тоже интересуетесь этой сферой — обратите внимание на JavaScript D3, Tableau, R и Flourish. У этих инструментов самые широкие возможности для дата-арта.

Подписывайтесь на блог Yandex.Cloud, чтобы узнавать еще больше новостей и историй об IT и бизнесе.

Другие истории, которые активно читают наши подписчики:

0
2 комментария
Name Noname

Интересно как выглядел бы metabase

Ответить
Развернуть ветку
Antony Alexsandrov

А как бы выглядело Pentaho ?

Ответить
Развернуть ветку
Читать все 2 комментария
null