Анализ Lead Time Distribution Chart

Анализ Lead Time Distribution Chart

Lead Time Distribution Chart (LTD Chart) — один из основных инструментов анализа статистики в Канбан-системах. Он помогает понять, как работает ваше подразделение, насколько предсказуемо и стабильно выполняются задачи, а также позволяет строить надёжные прогнозы по времени выполнения, с вероятностью 80-90%.

В этой статье вы узнаете:
- как устроен LTD Chart;
- как интерпретировать форму распределения LTD Chart?
- что такое мультимодальность, и как ее интерпретировать?
- как делать прогнозы времени выполнения на основе LTD Chart

Что такое Lead Time и как он измеряется?

Lead Time — это время, которое проходит от момента, когда задача проходит "точку принятия обязательств" (ТПО) - момент, когда заказчику явно дается обещание выполнить задачу, до момента прохождения "точки отдачи обязательств" (ТОО) - момента, когда заказчик получил результат и принял его.

Как измерять Lead Time
Как измерять Lead Time

Lead Time включает не только время на активную работу, но и все периоды ожидания — в очереди, на согласовании, в блокировках.

Например, если клиент запросил задачу 1 июня, а завершена она была 15 июня, Lead Time составит 14 дней. Даже если первые 10 дней над задачей не велось активной работы, и она чего-то ждала — это тоже часть общего времени Lead Time.

Как устроен LTD Chart

LTD Chart — это частотная диаграмма, которая показывает, сколько задач было завершено с тем или иным Lead Time.

Для построения этой диаграммы, по оси X откладывают значения Lead Time в днях - от нуля, до максимального наблюдаемого в статистике значения Lead Time, а по оси Y — количество задач, Lead Time которых равнялся соответствующему значению по оси X.

Анализ Lead Time Distribution Chart

Как "читать" LTD Chart - слева на оси X располагаются самые "короткие" по длительности Lead Time задачи - те что делались в пределах одного дня. В середине находятся средние по длительности задачи. Самые долгие задачи обычно формируют так называемый "хвост" распределения. Чем длиннее "хвост", тем больше в нашей системе аномально долгих задач.

Анализ Lead Time Distribution Chart

Чтобы сгладить временные колебания, и избежать ложных выводов, данные для LTD Chart должны браться за достаточно длительный период времени - от 3 месяцев. Если взять более короткий период времени то велик риск получить искаженную картинку, которая не отражает долгосрочной ситуации.

Форма LTD Chart

Анализ Lead Time Distribution Chart

Чем шире распределение LTD Chart - тем больше разброс возможных значений Lead Time наблюдается в нашем рабочем процессе. Это значит, что наша рабочая система подвержена влиянию каких-то факторов, которые размывают предсказуемость ее работы. И наоборот, чем более LTD Chart сконцентрирован около каких-то конкретных значений, тем меньше вариаций, и больше предсказуемость.

Вероятность Lead Time

Когда мы знаем как устроено распределение Lead Time, мы можем рассчитать вероятность того или иного значения Lead Time.

Ниже на картинке представлена формула расчета вероятности конкретного значения Lead Time

Анализ Lead Time Distribution Chart

Например, если мы хотим посчитать вероятность Lead Time равном 24 дня, то нам нужно знать две цифры:

1) Общее количество задач на графике LTD Chart. На графике ниже их 344

2) Количество задач на графике LTD Chart, время выполнения которых было меньше или равно 24 дня. На графике ниже их 327

Анализ Lead Time Distribution Chart

Тогда подставив эти цифры в формулу мы получим значение 95%. То есть вероятность Lead Time равного 24 дня для данного распределения, равно 95%

Мода распределения

Вершина, пик распределения называемся "мода". Она указывает на значение Lead Time, частота которого была больше чем у всех остальных.

Анализ Lead Time Distribution Chart

Психологически может показаться, что это и есть самое вероятное значение Lead Time, но это не так. Как правило, вероятность модального значения Lead Time колеблется в районе 18-28%

Так происходит потому что распределение времени интеллектуального труда (программирование, работа с контрактами, копирайтинг и так далее) обычно имеет скошенный характер, где основной массив данных сосредоточен в левой части графика, а справа часто имеется длинный "хвост". И этот самый "хвост" оттягивает на себя значительную долю распределения вероятности, и снижает вероятность модального значения Lead Time

Мультимодальное распределение

Довольно часто бывает, что график LTD Chart содержит несколько мод.

Анализ Lead Time Distribution Chart

Главный вопрос, который мы должны себе задать, когда видим несколько мод на таком графике: "А какого рода задачи преобладают в каждой из мод?"

То есть наличие нескольких мод, это повод для дополнительного исследования "наполненности" каждой моды конкретными характеристиками задач.

В ходе такого исследования может выясниться, что в одной моде большинство задач относились к типу "дефект", а в другой - "задачи развития", а в третьей - "задачи от генерального директора".

Анализ Lead Time Distribution Chart

По итогам этого исследования мы можем разделить наши данные выявленным характеристиками, и получить распределение с одной модой, и получим возможность более точно прогнозировать Lead Time по задачам с конкретными характеристиками

Метрики распределения для прогнозирования

Анализ Lead Time Distribution Chart

Так как мода не является надежной метрикой для прогнозирования, то важно обратить внимание на другие значимые метрики распределения - медиану и 85% перцентиль.

Медиана - это точка, слева и справа от которой находится половина всех значений данного распределения.

Чем интересна медиана - она показывает "центр тяжести" распределения, и указывает куда смещается большинство значений.

Почему нам нужна медиана, а не арифметическое среднее значение?

Арифметическое среднее значение очень подвержено влиянию аномально больших значений, и поэтому не стабильно. То есть в долгосрочной перспективе среднее значение может значительно поменяться не один раз, а вот медиана останется практически неизменной. То есть, как говорят математики, медиана - это робастная метрика, которую можно брать за основе долговременных расчетов.

Рассмотрим пример, который покажет разницу среднего и медианы.

Представим себе, что в комнате находится 10 человек, с зарплатой 50 тысяч рублей.

Вычислим среднее и медиану:

Среднее значение зарплат людей в комнате: 50 тысяч рублей

Медианное значение так же будет равно 50 тысяч рублей.

А теперь представим, что в эту комнату входит ТОП-менеджер с зарплатой в 800 тысяч рублей.

Тогда:

Среднее значение зарплат людей в комнате "скакнет" до 118 тысяч

А медианное значение останется прежним - 50 тысяч

То есть среднее поменялось от появление нового единичного большого значения, а медиана осталась прежней.

Анализ Lead Time Distribution Chart

Достаточно ли медианы для прогнозирования Lead TIme?

Какова вероятность медианного значения Lead Time? По определению, медиана, это точка ровно посередине всего массива данных распределения - это значит и слева и справа от него находится 50% значений. А значит вероятность медианного Lead Time равна 50%

Кажется, что 50% не очень подходит для долгосрочного прогнозирования времени выполнения задач. По сути, вероятность 50% говорит нам "вероятность что мы уложимся в срок, равна вероятности, что мы не успеем". И что нам с этим делать? Кажется такой вероятности явно не достаточно.

Хочется больше уверенности в прогнозе.

85% перцентиль

Какая ошибка в прогнозе приемлема для прогноза по времени выполнения задачи?

В среде Канбан-практиков считается, что ошибка 15% и меньше - вполне приемлема для большинства бизнес-задач.

Что это значит на практике? На практике это означает, что только 1 из 7 задач выйдет за пределы прогнозных значений. Или 15 из 100 задач.

Кажется, это действительно вполне приемлимый уровень ошибки. Особенно если эти 15% задач приходятся на не очень важные для бизнеса задачи.

85% перцентиль Lead Time позволит давать прогноз Lead Time даст нам прогноз именно с таким уровнем ошибок.

Самое приятное, что 85% перцентиль еще более робастная метрика, чем медиана. То есть влияние новых, аномально длинных значений Lead Time почти никак не повлияет на значение 85% Lead Time.

Это значит, что когда мы хотим делать долгосрочные прогнозы Lead Time, то нам стоит опираться на 85% или более высокие перцентили Lead Time (85%, 90%, 95%, 98%)

Чем нам полезен "хвост" распределения

Может показаться, что "хвост" распределения - совершенно бесполезная часть распределения, которая просто портит всю статистику и никакого смысла не несет.

Анализ Lead Time Distribution Chart

Это не так. "Хвост" несет колоссальное количество информации которая может помочь в кратном улучшении работы рабочей системы. Дело в том, что у каждого аномально долгого значения в "хвосте" есть причина, которая сделал его таким долгим. Можно собрать эти причины, сгруппировать их по схожести, и таким образом понять какие кластеры причин повторяются чаще всего, и больше всего влияют на появление аномально долгих задач. Затем для каждого кластера причин можно разработать контрмеры, которые сделают невозможным их появление в будущем. Таким образом, мы можем кратно улучшим качество и предсказуемость работы нашей рабочей системы, и ускорим ожидаемое значение Lead Time.

Полная PDF-инструкция анализа LTD Chart доступна по этой ссылке

Подробная инструкция, как построить LTD Chart в Excel

Больше материалов по анализу данных с помощью Канбан-метрик, можно найти в моем Телеграм-канале "Данные в действии"

PS Перепечатка материала или его части возможна только с согласия автора

Начать дискуссию