Управление персоналом с помощью больших данных

Весной 2022 года командой Социального кода и командой компании Вектор стартовал совместный проект по оцифровке личности водителей цементовозов и самосвалов (больших машин).

Немного бэкграунда

Вот такая сильная команда
Вот такая сильная команда

Компания «Вектор» обладает собственным парком самосвалов SCANIA, состоящим из одиночных самосвалов и сцепок, состоящих из тягачей и полуприцепов-самосвалов. Вся техника новая (2017-2018 гг. выпуска), находится на гарантии и обслуживается у официального дилера Scania. Это позволяет избегать серьезных поломок и, как следствие, не подводить клиентов. Каждый самосвал укомплектован 3 водителями-профессионалами, что дает возможность работать в режиме «Non-Stop» (без остановки) 24 часа в сутки 365 дней в году. Все самосвалы оборудованы системой управления автопарком «SPUTNIKAutoPARK», которая позволяет получать оперативную информацию о маршруте каждого грузовика в любое время суток. Установленные на автомобили датчики позволяют определить не только местонахождение каждого самосвала, но и качество оказываемых услуг. Водитель самосвала постоянно находится на связи с профессиональным диспетчером, который в круглосуточном режиме следит за ходом процесса перевозки и корректируют работу водителя по необходимости. За каждым клиентом закрепляется персональный менеджер компании, который своевременно предоставит информацию о процессе отгрузки.

«Вектор» предлагает песок, щебень и цемент только с официальных карьеров, с которыми выстроены партнерские отношения и выработана эксклюзивная ценовая политика. Каждая партия груза имеет все необходимые сопроводительные документы: сертификаты и паспорта качества.

Компания Социальный код занимается разработкой интеллектуальных и экспертных систем по оцифровке личности человека. Основной фокус команды направлен на поиск решений для искусственного интеллекта, способного "понимать" общечеловеческие качества личности, характер и другие свойства.

Социальным кодом реализован ряд своих продуктов и cvcode один из них. Накопленный опыт в сфере психометрических исследований, а так же своя достаточно большая база данных с репрезентативной выборкой по классам позволяет команде находить чувствительные параметры и строить точные прогнозы.

ИТшники :))) команда 
ИТшники :))) команда 

Этап №1 "Сбор данных"

Первое, что было сделано - это сформулирована задача на весь проект. Согласно техническому заданию, необходимо собрать личные ценности водителей и сделать ранжирование по степени важности. Затем, следовало совместить данные по личным ценностям (values) с негативными рабочими событиями (negative work events).

Собирали информацию о ценностях водителей. Ценности удалось обогатить данными благодаря Американским, Канадским и Европейским исследованиям психологических аспектов работы водителей на грузовых автомобилях, требующих специальных навыков и обучения.

Ценности, которые проверяли:

  • уважение;
  • оплата труда;
  • личное время;
  • рабочее время;
  • безопасность;
  • обучение;
  • подвижный транспорт;
  • ДТП и его негативные последствия;
  • навыки водителя;
  • качества водителя.

Весь тест-опросник был разбавлен также вопросами про аресты грузов, про веб-камеру внутри кабины, про наличие психолога в организации и так далее. Вопросы не имеющие отношение к делу предназначались для отвлечения внимания, чтобы респондент успел отдохнуть от шкал от 0 до 10.

Психометрическое исследование с использованием шкалы Ликерта (от 0 до 10) и с последующей проверкой согласованности ценностей в разных вопросах с помощью Альфы Кронбаха позволило собрать достоверные сведения с 114 водителей (58 оценок), что составило 58% выборки из всего числа водителей компании Вектор.

Основные препятствия на сборе данных:

  • не желание водителей проходить опросники;
  • закрытая система учета штрафов и нарушений;
  • некоторые водители вводили неверные данные.

Выводы для следующего раза:

1) Проводить беседу с коллективом на предмет важности тестирования.

2) Плотно сотрудничать с ЛПР, для получения большего объема данных.

3) Использовать другие способы сбора данных.

Этап №2 "Аналитика данных"

Собранный массив данных размерностью (114, 58) позволил провести достаточно интересное исследование о том, какие ценности водители отметили и как они коррелируют между собой. В данных наблюдались выбросы, которые являлись ни чем иным как небрежностью в заполнении формы теста-опросника (например, вместо 30 штрафов указали 300 или написали только имя Андрей). В целом, даже в столь незначительной выборке можно найти хорошие связи.

Мужчинам надо придумать больше имен, это реальная проблема :)))
Мужчинам надо придумать больше имен, это реальная проблема :)))

Многие исследователи данных посчитают это пустой тратой времени, так как данных всего (114, 58). Для данных без внутренних связей это небольшой набор. Стоит отметить, что данные собирались с помощью психометрического опросника, в котором уже заложены внутренние связи между ответами на вопросы. Таким образом, небольшая выборка усиленна смысловыми связями, проистекающими из психометрических законов, а значит, к корреляционным показателям можно применять усиливающий коэффициент.

Если посмотреть на данные в виде построенных графиков, то следует отметить первый набор это распределение штрафов среди выборки водителей.

Распределение штрафов водителей
Распределение штрафов водителей

Штрафы распределились в диапазоне от 0 до 34 за 36 месяцев работы. Конечно, были водители, которые работали менее 36 месяцев. Данные сбалансированы по методу весов. В расчетах мы старались использовать плотность получения штрафов в единицу времени, что помогло создать небольшой баланс.

Собранные данные с водителей, которые заполняли тест-опросник, объединены с данными о полученных штрафах. Сделан поиск корреляции значений. Корреляция ценностей водителей друг с другом показана на рисунке ниже.

Стоит отметить ярко-зеленые большие квадраты. Дело в том, что это матричная структура вопроса, где необходимо выставить от 0 до 10 баллов для 9-10 ценностей. Получается, увидеть какие вопросы явно выбивались из общего положительного настроя везде поставить 10 баллов. С одной стороны это значит, что ответы все таки были немного честными, а не конъюнктурными, а с другой стороны мы видим где водители задумались.

Карта корреляции ценностей водителей
Карта корреляции ценностей водителей

С помощью построения облаков тегов удалось распознать ценности более наглядно из всего массива данных. А именно хорошо взглянуть на то, что пишут в ответах и комментариях к вопросам.

Главные ценности водителей компании
Главные ценности водителей компании

Например, реакция на камеру в кабинет вот такая. Ответ: ДА или НЕТ надо было дать на вопрос об установке камеры видеонаблюдения в кабине для безопасности водителя. В комментариях был явный перевес в сторону НЕТ, не смотря на то, что ДА имело вес в данных. Высказывания эмоций по поводу камеры помогли менеджменту задуматься над этикой вопроса и о том, что необходима подготовка команды к таким нововведениям.

Слежка, отсутствие доверия, и так далее.
Слежка, отсутствие доверия, и так далее.

Между тем, мы не нашли никакой корреляции между стажем, возрастом, и количеством штрафов. fines_assumed - это то количество штрафов за нарушение ПДД, которое водители думали у них имеется. От 100 до 300 штрафов это единичные "выбросы" полученные в результате ошибки ввода данных (или эмоция водителя, который не хотел проходить опросник).

Ни возраст, ни опыт не показывают количество штрафов
Ни возраст, ни опыт не показывают количество штрафов

Обратим внимание на кластеризацию данных по ценностям водителей. Общий массив данных отдан алгоритму кластеризации DBSCAN, так как он достаточно популярный в научной среде. При всей неоднородности видно, что коллектив выборки делится на две группы: большую и малую. В ходе беседы с руководителем мы пришли к выводу, что это водители самосвалов (большинство) и водители цементовозов (меньшинство). Две группы работают с разными видами транспорта, и во многом имеют разные места базирования. Возможно, это и повлияло на их разницу в восприятии ценностей.

Социальный группы водителей 
Социальный группы водителей 

Цветность на данном изображении показывает количество полученных штрафов фактически. Светлые тона - мало штрафов, а темные тона больше штрафов. Как видно в одной и другой группах распределение похоже на одинаковое, самые светлые стоят особняком и возможно это не аномалия, а действительно люди, которые следуют правилам и не стремятся быть в коллективе.

Итоги и выводы

В данной длинной статье мы рассмотрели как можно на небольших исследованиях провести достаточно интересную поисковую работу. Удалость провести опрос большего числа сотрудников компании и собрать обратную связь на волнующие руководителей вопросы. Помимо сбора психометрических данных, удалось оценить отношение водителей к нововведениям в рабочий процесс: психолог, страхование, приложение и видеонаблюдение в кабине. Организация сбора данных в компании с Цифровой культурой II уровня (по ссылке статья про это) подсветила слабые места системы сбора и хранения данных, а также ответственность должностных лиц, регламенты сбора данных и другие вопросы.

Аналитика как числовых закономерностей так и семантических связей показала насколько многогранен сотрудник компании. Не смотря на ежедневную рутину, сотрудник компании - это индивидуальная личность, со своими сложными механиками поведения, взглядами, ценностями и потребностями. Руководители нередко забывают это в процессе управления и относятся ко всем как к единицам производственного процесса, что в корне не верно.

Подобные исследования, на мой взгляд, это необходимость для современной компании. Результаты, как и сам процесс исследования, полезны не только собственнику и топ-менеджерам, но и самим сотрудникам. Тесты и опросники позволяют провести анализ себя на целостность, задать важные вопросы о себе и своем поведения. Я уверен, что подобные практики повышают общий уровень сознания в организации, и улучшают Социальный код каждого лично.

Переходите на cvcode.ru (https://cvcode.ru) - улучшайте свой интеллект и коммуникацию вместе с нами.

С уважением,

Аментес Артем Важаевич

Записаться на бесплатную консультацию ко мне можно по ссылке

11
Начать дискуссию