Что такое модель данных Power BI?

Что такое модель данных Power BI?

Если вы не знаете (или не уверены на 100%), что такое модель данных Power BI, вы попали в нужное место. В этой статье вы узнаете, что такое модель данных и она станет для вас полностью понятна.

Что такое модель данных?

И так, модель данных - это набор:

  • загруженных таблиц данных с одним или несколькими столбцами и с одной или несколькими строками данных
  • отношений между загруженными таблицами

*написанными мерами (формулами), которые применяют бизнес-правила к необработанным данным для извлечения бизнес-информации (например, цена продажи минус себестоимость является прибылью), в том числе сами формулы

*форматированиями, применёнными к формулам названия компаний, указанные в формулах

Все вышеперечисленное составляет то, что называется «моделью данных» в Power BI (также для табличных служб Analysis Services, Power Pivot для Excel и, без сомнения, бесчисленного множества других инструментов бизнес-аналитики).

Зачем нужна модель?

Power BI - это инструмент отчетности бизнес-аналитики на основе модели данных; не все инструменты бизнес-аналитики основаны на модели данных. Одним из примеров инструмента бизнес-аналитики, не основанного на модели данных, являются службы отчетов SQL Server (SSRS). SSRS - это инструмент бизнес-аналитики, не основанный на модели данных. Инструменты отчетности бизнес-аналитики, не основанные на модели данных, требуют, чтобы средство записи отчетов сначала сгенерировало запрос для извлечения данных из базы данных (обычно SQL Server) и возвратило результаты этого запроса в SSRS, чтобы результаты можно было отобразить в отчете. Многие такие инструменты отчетности, не имеют пользовательский интерфейс, который помогает с генерацией запроса (если вы хотите его использовать), или вы также можете использовать язык сценариев, такой как T-SQL, для получения данных, которые вам нужны для каждого отчета.

Второй пример - Excel. Традиционный Excel - это также инструмент бизнес-аналитики, не основанный на модели данных. Под традиционным Excel подразумевается инструмент для работы с электронными таблицами без современных надстроек бизнес-аналитики Power Query и Power Pivot. В случае традиционного Excel пользователь загружает данные в электронную таблицу, а затем логически связывает и объединяет данные с помощью формул Excel и строит отчет (часто на новом листе) для обобщения и представления результатов (отчет).

Не путайте здесь «инструмент» с «инструментом на основе модели данных». Excel определенно является хорошим инструментом - это очень гибкий инструмент, который позволяет создавать практически любой отчет, не будучи программистом. На самом деле Excel, вероятно, лучший и самый популярный инструмент бизнес-аналитики, но без модели.

Нет ничего плохого в использовании инструмента бизнес-аналитики, не основанного на модели данных - просто это другой подход к использованию. Самая большая «проблема» с инструментами отчетности, не основанными на модели данных, заключается в том, что каждый раз, когда вам нужен новый отчет, вам нужно начинать все сначала, с нуля. Каждый отчет имеет единственную цель с очень небольшой возможностью повторного использования или расширяемости.

Преимущества инструмента на основе модели данных, такого как Power BI:

  • Автор «модели данных» создает возможность многократного использования (модель данных), которую можно использовать для решения текущих требований к отчетности, а также (часто) будущих требований без необходимости возвращаться и писать дополнительные запросы для получения нового подмножества данных.
  • Автор часто может быть бизнес-пользователем (обычно с хорошими навыками работы с Excel) - им не обязательно быть профессионально подготовленным администратором баз данных или специалистом по SQL.
  • Модель носит «концептуальный» характер и поддерживается удобным интерфейсом, который позволяет вам «построить» модель логически с минимумом программирования. Примечание: вам нужно будет немного кодировать (писать формулы) для хорошей модели, но не сложнее, чем средняя таблица Excel, если у вас есть навыки.

Представление модели в Power BI Desktop

Внутри Power BI Desktop вы найдете «представление модели». На изображении ниже показана табличная структура базы данных Adventure Works.

Что такое модель данных Power BI?

Выше вы видите:

  • Таблицы
  • Столбцы в таблицах (хотя это не лучший вид для столбцов - для этого лучше использовать просмотр данных)
  • Отношения между таблицами (если они есть)
  • Типы отношений (все вышеперечисленные - «1 ко многим»)
  • Направление распространения фильтра между таблицами с использованием отношений

То, что вы не видите в этом представлении модели, - это меры (формулы, которые генерируют бизнес-концепции из необработанных данных).

Меры - часть вашей модели

Как уже упоминалось выше, меры являются частью вашей модели данных. Меры - это набор стандартных инструкций, которые сообщают Power BI, как извлекать бизнес-концепции, и они составляют часть вашей модели данных. Позвольте проиллюстрировать это на примере.

Рассмотрим столбец ExtendedAmount из таблицы продаж (показанной ниже).

Что такое модель данных Power BI?

Это столбец чисел, который хранится в таблице продаж в модели данных. Эти числа представляют собой общую стоимость позиции продаж (одна строка в таблице - одна позиция). Например, если вы приобрели 2 продукта по 5 долларов каждый, ExtendedAmount составит 10 долларов. Отсюда следует, что:

  • Если сложить столбец, он покажет общую стоимость всех сделок по продаже.
  • Если посчитать значения в столбце, он скажет сколько позиций продаж имеется во всех продажах.
  • Если усреднить значения в столбце, он покажет среднее значение, потраченное клиентами на все позиции продукта.
  • Если найти максимальное значение в столбце, он сообщит самое большое значение отдельной строки, которое возможно в столбце.

Power BI более чем способен выполнять все вышеперечисленное без необходимости писать какие-либо формулы. Но Power BI не имеет представления о том, что означает каждая из приведенных выше формул в бизнес-контексте. Он может производить вычисления, но не может дать вам хорошее название компании для результата или выбрать наиболее подходящее числовое форматирование для результата. Если вы хотите этого, вам нужно сделать это самостоятельно. Вам необходимо расширить модель данных, включив в нее меры (формулы) в соответствии с вашими потребностями. Вы можете написать следующие меры:

Что такое модель данных Power BI?

Это всего лишь простые примеры, которые работают с одним столбцом данных. Все это можно вычислить с помощью Power BI без необходимости изучать какой-либо язык формул DAX. Но если вам нужно что-то более сложное (и, вероятно, более полезное), вам обязательно нужно изучить DAX, чтобы получить максимальную отдачу от Power BI.

Ваша модель - это ваш актив

О модели данных Power BI можно думать как об активе - о том, что вы создаете и улучшаете с течением времени. Чем больше усилий вы приложите к своей модели, тем она станет ценнее. Когда приходит время построить новый отчет по вашим данным, вам не нужно начинать заново (как вы обычно делаете с инструментами, не основанными на моделях). Вместо этого вы берете свой актив (свою модель данных) и повторно используете его. Если вдруг вам не нужно ничего менять, но нужно сделать что-то новое, вы можете просто построить новый отчет поверх существующего актива. Иногда вам нужно будет немного улучшить свой актив, чтобы удовлетворить новые требования. В этом случае вы сначала опираетесь на ранее созданный актив, а затем на его основе строите новые отчеты.

Начать дискуссию