Стартап в поисках смысла - часть 3: Как очистить данные и сделать выводы?

Любой процесс принятия решений сложно сегодня представить без сбора и обработки данных, будь то инвестиционное, стратегическое или управленческое решения. Данные стали источником важного конкурентного преимущества. Хотя информации много, основатели или инвесторы пребывают в постоянном поиске новых данных, способных добавить уверенности в принимаемом решении.

Несмотря на доступность информации, мало кто умеет добывать, анализировать, делать выводы и принимать решения на основе данных. В итоге люди предпочитают искать дальше, думая, что для принятия решения информации недостаточно.

Основатели компаний анализируют и следят за огромным количеством данных, метрик и KPI. Им кажется, что контролируя большой объём данных, они получат инсайт. Однако большое количество информации создает шум в голове и притупляет важность сигналов, издаваемых данными.

Основная магия работы с данными в том, что каждый видит в них "свою" правду и делает свои выводы, особенно если задача не сформулирована четко или цель исследовать явление.

Для того, чтобы увидеть в данных что-то, их необходимо очистить – это основная работа. Далее мы проговорим несколько простых правил, следуя которым, количественные данные будут говорить с вами на одном языке:

1) Нормализуйте данные – не сравнивайте яблоки с апельсинами

К примеру, вы хотите поехать в романтическое путешествие, и выбираете город, анализируя количество путешественников. В этом случае вы получите самые посещаемые туристами города, скорее всего, бизнес назначения. Это очень распространённая ошибка. Синхронизируйте «контент». Контент должен совпадать по смыслу, единицам измерения, периоду и другим важным параметрам.

2) Сглаживайте количественные и качественные выбросы для получения большой картинки, и наоборот обрабатывайте выбросы отдельно для получения инсайтов

Если бы вы проводили проблемное интервью с фанатами, коллекционерами, или другими глубоко вовлеченными представителями, вы бы услышали слишком много лишнего, отличительного от мнения среднестатистического пользователя, на которого нацелен ваш продукт. Экспертные мнения могут содержать почву для размышления однако учтите, в целях развития клиента, подтверждения проблемы или других исследований убирайте такую информацию.

Вот пример количественного выброса: анализируя данные мобильного приложения, я заметила, что в одном из месяцев скачек было в три раза больше обычного. Такой скачок должен иметь причину, возможно была акция или подтвердилась какая-то гипотеза. Стали копаться, выяснилось, что все сводит к 2 дням – а именно к нескольким часам, когда опинион лидер профессии, сказал что сам пользуется приложением. Нельзя сказать, что такое явление имеет отношение к бизнесу, поэтому мы сгладили этот выброс, зато стало ясно, что блоггеры могут стать каналом привлечения аудитории в нашем конкретном случае.

3) Сначала исключите сезонность, дни недели, время суток и месяцы года потом обработайте их отдельно – часто они скрывают инсайт о поведении ваших клиентов

Помните что ваши клиенты обычные люди, которые любят начинать новую жизнь каждый год с первых чисел января и потом каждый понедельник на протяжении всего года. Приведу в пример приложение, где мастера красоты ведут свои расписания: мы заметили, что мастера заходят в приложение в разы чаще в понедельник, вторник и среду и этот тренд заметно снижается с четверга по воскресенье, к выходным достигая своего дна. Причина в том, что люди мыслят неделями и планируют с понедельника, поэтому во второй половине недели записи уже закрыты. В нашем случае количество записей напрямую влияло на лояльность и срок жизни мастеров. Эту информацию можно использовать для пушей новых мастеров, стимулируя их вносить записи в приложение в те дни, когда они делают это чаще – понедельник, вторник, среду.

Вот другой пример из бьюти-индустрии - выяснив, что самые слабые продажи были в пятницу, мы сделали пятницу днем бесплатной доставки по Москве.

4) Найдите опережающую метрику - ищите данные, которые связаны между собой причинно-следственной связью

Если вы понимаете как связаны данные, то можете найти метрику, влияя на которую, можно влиять на ключевые элементы бизнес-модели.

Есть разница между коррелирующими и причинно-следственными данными. К примеру, была установлена связь между количеством съеденного мороженного и количеством утопленников – это коррелирующие данные. Очевидно, что между этими двумя явлениями не хватает связующей информации. Их связывает сезонность – лето – это причинная метрика. Вам нужны такие же причинные метрики.

Facebook, к примеру, ориентируется на активность своих новых пользователей – если новый пользователь в течении первых 10 дней добавляет хотя бы 7 друзей, он с большой долей вероятности будет активным. Dropbox “предсказывает” активного пользователя по факту создания хотя бы одного файла и хотя бы одной папки на любом устройстве.

В примере мобильного приложения, где мастера красоты ведут свои записи, нам удалось выявить, что если мастер совершает в первый месяц менее 14 записей, то он не продлит подписку на второй месяц. Такие мастера не наши целевые, так как работают от случая к случаю и их острая проблема в отсутствии достаточного количества клиентов (а соответственно и записей), поэтому они не видят смысла в оплате приложения, которое предлагает им удобство. Для нас это значит, что первый месяц в своем роде решающий - за это время мы должны 1) отсортировать нецелевых (меньше 14 записей в месяц) и 2) вовлечь целевых в приложение. Направляя свои действия на стимулирование количества записей, и, руководствуясь этой метрикой для новых пользователей, можно опосредованно влиять на вовлеченность, средний чек, цикл жизни и доход компании.

5) Группируйте и выделяйте категории – это сильно упрощает и систематизирует работу с данными

Недавно мне пришлось работать с месивом. Имелось более 100 000 товаров с «ручным» описанием: «женская жилетка из шерсти, в клеточку, с пуговицами и кожаной отсрочкой 42-44 размера», или «сумки с ремешком через плечо, металлическими вставками Prada». По каждому товару была информация о том, кто ввез, сколько, какой стоимостью, НДС и масса другой информации. Прежде чем что-то увидеть, мне пришлось выделить несколько категорий товаров, например «одежда для дома» или «одежда для детей» или «аксессуары из кожи» и тд. И только когда масса была структурирована, можно было приступить к обработке данных и их анализу. Без этой очистительной работы данные были непрозрачны. Иногда структурированием можно отформатировать качественные данные и потом работать с ними как с количественными, однако пусть структурирование не станет вашей самоцелью.

6) Учитывайте закон малых чисел

Закон гласит - по мере роста абсолютного значения показателя, замедляется темп его роста - большие компании не могут расти также как маленькие, хотя точнее будет сказать, что рост крупных компаний не слишком отклоняется от средних темпов роста. Когда цифры малы, что бывает в начале жизни компании или при небольшой выборке, разброс темпов роста может быть в обе стороны какой угодно большой. Отрицательные значения не учитываются поэтому от молодых компаний ждут сверхбыстрого роста. Это надо учитывать когда вы видите в презентации трехзначный рост и используете его для прогнозирования. К примеру, подписка вашего папы может дать вам рост продаж в 100%, если он у вас второй клиент.

Когда вы сравниваете свой бизнес с аналогами или конкурентами соотнесите размеры сравниваемых параметров.

7) При когорном анализе используйте подписку на один месяц

Если у вас подписка и вы строите когорты, используйте в целях анализа когорт подписку на один месяц, если вы только начинаете свой бизнес - тем более. В противном случае, когда у вас много клиентов и вы смешиваете клиентов оплачивающих один месяц и клиентов, оплачивающих на год вперед, вы не получаете ясной картины, так как информация о том сколько клиент живет с вами, насколько он активен и сколько раз он принимает решения об оплате – дают нам совсем разную информацию.

8) Сегментируйте клиентов и обрабатывайте информацию по каждой группе отдельно

Сегментируйте клиентов по продуктам, подпискам, оплатам, чекам и другим параметрам. Сначала вы можете даже не подозревать о значимости такого выявления групп. Однако, сегментируя их по разным признакам, вы натолкнетесь на разные мотивы, проблемы и сможете выделить несколько паттертнов поведения или принятия решений разных групп ваших клиентов. К примеру, некоторые клиенты интернет магазина по продаже косметики приобретали средства в этом магазине только при условии, что им удавалось забронировать другой флагмановкий продукт этого же сайта – боксы с пробниками косметических средств; если им не удавалось приобрести эти боксы, они даже не заходили в интернет магазин. Это говорит о том, что такие клиенты являются постоянными и лояльными клиентами именно боксов, а в интернет магазине покупают что-то в довесок. Это отдельный сегмент в данном случае, отличный от средстатистического портрета клиента косметического интернет магазина, и для них надо формировать отдельную ценность.

Количественные и качественные данные поддаются разным законам. При запуске продукта, на старте продаж у вас будет больше качественной информации – результаты интервью, письма, беседы. Эти данные как правило трудно структурировать и обрабатывать. Хотя именно они часто содержат инсайт. Количественные данные напротив, накапливаются со временем, их легче структурировать, легче обрабатываются, но они почти не содержат инсайта.

Проблема с выборкой – тонкости оценки информации

Уверенность в принимаемом решении на основе данных или в гипотезе опирается на два аспекта данных: силу и весомость данных. Например, вы хотите проверить, что при подбрасывании монет чаще выпадает орел. В этом случае доля орла в выборке отражает силу, а количество бросков – размер выборки – определяет их весомость. Здесь важно учитывать, что в человеческом сознании сила данных преобладает над весомостью. Такое смещение ведет либо к чрезмерной, либо к недостаточной уверенности. Когда сила данных велика, а весомость мала (то есть данные слабодоказательные), люди склонны к чрезмерной уверенности. И наоборот, когда сила данных невелика, а весомость значительна (то есть данных много и выборка показательна), люди склоняются к недостаточной уверенности. Весомость выборки определяет можно ли доверять данным. Когда молодые компании строят воронку продаж – часто они пишут в презентациях – конверсия в продажу 75%, а потом выясняется, что конверсия посчитана от 4 клиентов. Сразу возникает вопрос – какой будет конверсия при 10 000 клиентах?

Где брать данные?

Всегда кажется, что «тех самых данных», которые раскрывают нам истину, недостает. Спешу вас заверить, что самые ценные данные у вас есть и скорее всего вы сами их собираете.

Наверняка у вас есть следующая информация:

§ Id клиента (что-то, что идентифицирует клиента: телефон, почти, номер и тд)

§ Дата каждой покупки

§ Чек каждой покупки/корзины (подписки обрабатываются согласно рекомендации в пункте 6)

§ Количество товаров за покупку / в корзине (здесь надо настроить под ситуацию)

Вы можете фиксировать эту информацию каждый день. Пусть id клиентов повторяется сколько угодно раз в вашем списке. Если у вас разные продукты рассматривайте одного клиента как отдельного для каждого продукта или выделите группу клиентов, приобретающих несколько продуктов. Возможно вы натолкнетесь на «продающие» или «дополняющие» продукты.

Перечисленной выше информации достаточно для формирования портрета клиентов, выявления сегментов, вы можете понять мотивы каждой группы, объединенных одним или более параметрами, понять как увеличить средний чек, как увеличить цикл жизни клиентов, доход и многое другое! Начав обрабатывать имеющуюся информацию, вы поймете куда копать дальше, с каким сегментом клиентов поговорить, кому что предложить и тд.

Не зацикливайтесь на данных

Работа с данными хорошо подходят для ситуаций, когда задача трудна и подчиняется правилам. Однако, когда вам надо принимать решение в сложной среде, вы, скорее всего, используете натуралистический подход, который используют пожарные. Он сводится к тому, что вы поступаете согласно первой идее, пришедшей вам в голову, и потом ищите лучшие решения. Более опытные в своих областях люди и эксперты также редко опираются только на данные. Они мыслят паттернами, моделями, быстро связывая ситуацию с той или иной моделью.

Как много данных необходимо для принятия «лучшего» решения?

Правда в том, что чем большей информацией вы владеете, тем вам сложнее принять решение, сделать вывод или расставить приоритеты. Сам процесс сбора, обработки, структурирования и владения данными помогает нам чувствовать большую уверенность относительно принимаемого решения или наших действий, а вовсе не принимать лучшие решения или действовать правильно. Мы не можем знать был бы исход принятых решений сильно «лучше» исходов, если бы мы владели еще большей информацией. Поэтому остановите процесс поиска "той самой" информации и учитесь работать с имеющимися данными.

11
1 комментарий

Секс)

Ответить