{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Как разделить показатели по отделам, если выгрузка данных не содержит нужной информации?

Недавно мы столкнулись с такой задачей: потребовалось рассчитать определенные показатели в разрезе профильных отделов, но выгрузка из ПО не содержала такой информации. Тогда из столбца данных «кратное описание» мы выбрали ключевые слова и, распределив их по категориям, установили связь между данными и принадлежностью к одному из отделов компании.

Исходные данные:

Способ 1

Используя возможности интернет-сервиса WordArt.com, мы составили Облако ключевых слов (для создания Облака использовались текстовки из поля «Краткое описание» исходных данных за предыдущий год):

Для установления связи между ключевыми словами и отделом, был использован DAX Power BI (функции MID и IF):

Справочно: MID () — выводит часть текста заданной длинны с учетом первоначальной позиции. MID («Текст»; Позиция; Количество Символов), где:

* Текст – исследуемый текст или столбец с текстовыми данными

* Позиция – номер позиции символа, с которого нужно выводить текст

* Количество Символов – количество символов, которые нужно вывести

После стандартного подключения через Power BI к базе данных, мы создали новый столбец с названием «Отдел» (через вкладку «Моделирование») с условием:

Отдел = IF(MID([Краткое описание];1;12)=“Документация”;”Отдел 3”; IF(MID([Краткое описание];1;14)=“Застрахованный”;”Отдел 2”; IF(MID([Краткое описание];1;10)=“Управление”;”Отдел 1”.

Формула читается следующим образом: если в поле «Краткое описание» с 1 по 12 символ указано «Документация», то по данной строке в столбце «Отдел» проставляется признак принадлежности к Отделу 3 (условное название) и т.д.

Данный метод может быть применим при определенных условиях:

  • надо быть уверенным, что в словах из поля «Краткое описание» АС не допущены неточности, например, вместо «Документация» занесено «Документаци» (недописана буква), иначе вышеуказанная формула не сработает, и распределение не произойдет;
  • если количество текстовых условий, которые необходимо прописать в формуле незначительное, иначе формула получается слишком «тяжелая».

Способ 2 (в нашем случае оказался более подходящим):

Мы перенесли облако слов в память программы таким образом, что при нахождении в поле «Краткое описание» (в независимости от символьной позиции) слова или словосочетания из облака, производилось бы автоматическое присвоение признака соответствующего отдела.

Для решения задачи был создан условный столбец в Power BI, который вычисляется исходя их данных других столбцов или значений:

При работе с условным столбцом мы выбрали имя поля, по которому будет задано условие, а именно «Краткое описание», указали непосредственно само условие, выбрав тип оператора – «Содержит», перенесли данные из Облака слов в поле «Значение» и прописали результат – проставление в столбце «Отдел» признака соответствующего отдела в зависимости от ключевого слова из облака слов.

В результате, в таблицу добавился столбец с информацией о принадлежности данных к соответствующему отделу, что позволило работать с информацией в разрезе отделов компании.

Таблица исходных данных приняла следующий вид:

0
Комментарии
-3 комментариев
Раскрывать всегда