Почему выпускники курсов далеко еще не аналитики
Дисклеймер
Я не хочу и не собираюсь оскорблять или унижать студентов курсов по аналитике -- вы огромные молодцы, что начали учиться. И сердечко в принципе всем аналитикам, потому что вы супер-ребята, чердаки которых занимаются неимоверно сложным процессингом. Статья больше относится к тому, чему и как обучают на курсах и кто потом идёт работать в бузинесс.
Я работаю в поганом диджитоле без малого 10 лет, больше половины этого срока я занимаюсь аналитикой. На моих глазах формировалась новая каста - специалисты диджитал-профессий, к которой я причастен чуть позже, чем со старта.
Стремительное формирование аналитики началось примерно в 2016 году, когда вдруг начало звучать отовсюду...
Большие данныеееееее!!! Блокчейн!!! Аналитикааа!!!
На эдтех-площадка вдруг начали появляться небольшие курсы по типу этого, я залетел на один из первых.
На курсы шли всякие бэкенд-разработчики, которые повышали свою квалификацию, потому что... бизнесы начали накапливать неприлично много данных, с которыми надо было учиться как-то работать.
Я закончил курсы по Экселю и веб-аналитике - этого было более чем достаточно даже для работы на международке для моих задорных аналитических задач.
Что на самом деле хотят слышать от аналитика
Когда ты маркетолог и занимаешься аналитикой, то в твою копилку падает один очень забавный вопрос:
Что значат все эти таблицы, графики, вероятности, разбросы и прочая визуально-цифровая херня
После курсов по Экселю, веб-аналитику, просмотра курса по большим данным и прочего самообразовательного материала мне пришлось настраивать голову так, чтобы я отвечал на очень прикладные вопросы, соотносящиеся с действительностью.
И поэтому, когда я раскидывал уже в Google Bigquery на квантили какую-то херню, я объяснял, что "вот этот объём трафика ведёт себя так, а вот эта доля - самая большая - у нас остаётся в таком состоянии; и, судя по специфике рассылки, тут важно, с продуктовой точки зрения..." и бла-бла-бла.
Когда вы занимаетесь анализом (пока назовём их так) цифр, в отчетном итоге никому нахер не нужны ваши графики и таблицы. Всем нужно понятное человекопонятное конкретным людям из конкретного бизнеса умозаключение о том, что происходит.
У данных, накопленных бизнесом, есть нарратив, то есть они имеют некоторое конкретное значение в конкретном бизнесе.
Жаркий кейс 1. "Эх, Семён Семёныч..."
Работаю я, значит, в Яндекс Плюсе и случается у нас День рождения - это когда на рубеже мая-июня Яндекс весело повышает вовлеченность в экосистему и раздаёт баллы за каждое новое касание в пределах систему, тем самым прививая привычку использования сервисов.
А теперь как в анекдоте...
Нам надо было сделать рассылку на тех, кто уже есть в системе лояльности. Аналитик нам варит данные на N миллионов пользователей, отдаёт выборку, по которой надо отправить. Отдаёт таблицу по схеме:
userId | points
(идентификатор в БД | накопленные баллы)
Я маркетолог, занимаюсь своими маркетинговыми делами, не проверяю данные. Отправляю. Через минут 15-20 ко мне вламывается то ли марк. дир., то ли коллега какая-то, то ли мой тимлид с таким вот скриншотиком.
А теперь развязка...
Аналитик, как я понял, больше дата-сатанист и, по его словам, "шум [применяю термин в упрощенном виде, то есть доля смыслово невалидных для задачи строк] в данных был меньше 0,00001%".
В этот день впервые пред моими глазами угас ореол величия опытных аналитиков. И я понял: чувак-то правильно сварил данные, но... он не понимал, в чём особенность конкретной рекламной кампании и почему даже такой шум нельзя допускать.
Жаркий кейс 2. "Ну я ж аналитик"
Несколько лет назад залетает на проект искромётный фриланс-аналитик со стажем около 2 лет, выпускник большого эдтеха и который прямо сейчас учится в нишевом. Попадаю с ним на общую задачу по анализу базы пользователей, на основе всего это надо будет запускать CRM-маркетинг примерно по таким направлениям:
- Автоматические цепочки
- Массовые рассылки
- Сервисная автоматика
Поставил внятно задачу, что мне нужно понять, сколько таких-то юзеров тут, как они себя ведут в динамике, указал в каких данных, какие ответы надо найти и как их показать, потому что на этом будут приниматься решения о запусках и интеграции. Задачи одобрены заказчиком, все данные есть, доступы к БД есть - полетели работать.
По NDA не могу показать конкретные вещи, однако через 3 недели я получаю в ответ пачку задач:
- Развернуть на сервере таком-то вот такую-ту БД
- Стандартизировать такие-то данные из таблиц 1, 2, 3, N
- Подключить Tableau к новой БД
В довес получаю самое интересное и обозначенное как результат работы в виде 40 скринов из Jupiter Notebook, типа такого:
Сразу подумал, что "ну возможно я дурак и не разбираюсь в глубоких хитростях аналитических пируэтов и не прочувствовал музыку визуализации" - пойду на звонок
Прихожу на звонок, думая, что сейчас познаю еще пару-тройку прикольных граней бытия, но х%ем по лбу ударила реальность (схематично объясню):
- Вступительная лекция - это про стандартное распределение
- Мы узнали про десятки отклонений одних событий от других
- Нам поведали про хаотичность временных рядов
К своему стыду не могу вспомнить всего, что мы узнали об этих таблицах, но ответов на наши вопросики мы так и не получили. Я ждал 3-4 когорты с фильтрами, пару таблиц в динамике. Если что для меня с использованием SQL это задача на неделю-две (у меня с индексами слабовато, поэтому занимает больше времени), вычисления достаточно простые.
Ожесточенная беседа вывлилась в то, что заказчик стал на сторону аналитика, а я спокойно вышел из этого консалтинга. Долго думал, почему так получилось и только на днях до меня дошло благодаря некоторой встрече.
Все эти выпускники хорошо и даже кто-то блестяще владеют всеми инструментами в виде мат. формул, библиотек, терминов, сложных вычислений, написания кода и так далее, но... с одной стороны, они совсем не понимают, как эти вычисления переложить в прикладную плоскость, с другой стороны, они не понимают, как трактовать результаты своих экзерсисов под конкретный контекст. ТО ЕСТЬ стандартное распределение для таблицы в фудтехе и эдтехе считается одинаково, а вот значить они будут радикально разные вещи.
Как обозначает Эдтех + показать поисковую выдачу
Откуда всё это растёт
Кто учит
Учат многие, причём я работаю в эдтехе, но, познакомившись с выпускниками, я вижу примерно одну и ту же картину:
- Уверенное владение инструментами
- Непонимание бизнес-нарратива анализируемых данных
Классика в аналитике - это задача про предсказание, у кого какая вероятность выжить на Титанике.
И вот как раз такие глобальные задачи решать - это норм для самого старта, но... подавляющее большинство аналитиков пойдут в бизнес, часть в промку, еще меньше в науку. И только самая небольшая часть будет работать с данными общего гуманитарного назначения, без каких-то нарративов.
И, получается, что эдтехе дают нам операторов формул, Питона, Юпитер-ноутбука и прочего инструментария, но не объясняют, что...
- Чувак, вот есть бизнес такой-то
- На продукте такой пользовательский путь
- Значение данных такое-то
- Вот это про это, а тут про то
Аналитики не понимают бизнес-теорию, в то время как конкретный бизнес генерирует данные отличные от других бизнесов и которые надо рассматривать в рамках конкретного нарратива.
Справедливости ради скажу, что данные и-кома сильно ближе к естественному человеческому поведению, потому что строятся на базовых потребностях (но об это сильно позже).
А вот что сами эдтехи пишут в своих лидгне-статьях про то, что должен уметь аналитик:
А вот это примерно то, что у нас есть всегда на выходе
Кто заказчик
Тут коротко. Бизнес-овнер часто вообще не понимает в аналитику и случается одна из трёх ситуаций:
- Бизнесу повезло и у него есть бабло. Аналитика превращается в поток изготовления дашбордов и все с восхищением смотрят на бесконечные графики, пайчарты и прочие столбчатые диаграммы
- Бизнесу повезло и он умеет считать деньги. Аналитика превращается в автоматизацию бухгалтерской отчетности в виде десятков отчетных таблиц
- Бизнесу не повезло ни в чём. Аналитика делается, но не понятно, зачем она делается
К счастью, есть ситуации, когда с топ-менеджментом всё в полном порядке и все умеют читать цифры и понимать, что они значат.
О нарративе данных (авторское)
Сейчас, возможно, кому это покажется тотально дичью, поэтому ВСЁ СЛЕДУЮЩЕЕ НОСИТ ХАРАКТЕР МОИХ ЛИЧНЫХ НАБЛЮДЕНИЙ ЗА ТЕМ, КАК ВЕДЁТ СЕБЯ ТРАФИК В ЗАВИСИМОСТИ ОТ СПЕЦИФИКИ ПРОДУКТА.
Данные, с точки зрения сложности использования и интенсивности эмиссии, тем сложнее, чем выше продукт, из которого данные собираются, в пирамиде Маслоу.
Берём ступень физиологических потребностей и бизнесы, которые с этим работают
- Ритейл
- Фарма
- Недвижка
Рынок всегда актуален и постоянная высокая волотильность обеспечивает скорейшее воскрешение после кризиса. У этих бизнесов только один блокер - смерть. Потому что пока человек жив, ему нужно где-то жить, что-то есть и вылечиваться.
Набор данных, их поток и разнообразие полностью продиктован физилогической составляющей, а поэтому не сильно разнообразный и поэтому аналитизировать их достаточно просто и значение по умолчанию всем понятно. Более того, ошибки в данных будут прощены в силу специфики.
На студень физиологических потребностей
2022-2024 годы доказали, что на безопасности можно делать не просто большие деньги, а огромные: рост новостных ТГ-каналов сильно выделил эту потребность человека.
Что касается данных, в новостных изданиях всегда есть достаточно понятная разметка: тематические теги и автор - это и есть костяк. В целом, если аналитик не психопат и включит эмпатию, то он быстро начнёт смекать, как это использовать в исследованиях.
Социальные потребности
И это уже куда более высокая ступень, где эмиссия возможных вариаций данных увеличивается в геометрической прогрессии, потому что социальное может быть выражено во всём (в прямом смысле) возможном многообразии.
Здесь у нас разные культурные маркеры и жанры литературы, музыки и т.п., кулинарные особенности, особенности профессиональных решений.
Как раз здесь начинается тотальная разница, когда на какую реальную социальную задачу накладывается нарратив бизнеса - отсюда же растёт конкуренция, отсюда же растёт нарратив для данных.
С вашего позволения остановлю движение лифта по пирамиде Маслоу, ибо дальше больше и запутаннее, там лучше работать людям с людьми.
Ну а как надо-то?..
Я стараюсь подсветить только увиденные боли, но аналитикам, когда мы их учим чему-то, надо сначала объяснить с чем он вообще работает:
- Вероятность снижения оттока на подписочном продукте - это не та же самая вероятность, что и шанс на выживание на Титанике
- Продуктовые свойства блюд в сети мишленовских ресторанов - это не то же, что поток блюд в сети столовых
- Движение по фичам в SaaS-сервисе для SEO-спецов - это не такое же движение, как в пределах кабинета Яндекс Директа
Рыночек: где реально можно заняться аналитикой
На самом деле бигтехи, промка и прочие мегаладоны формируют и растят свои аналитиков годами, туда, насколько мне известно, очень ограниченное количество людей может открыть дверь с ноги. И там уже есть кому заняться точными вещами.
Больше всего в аналитике с внятными выводами нуждаются средний бизнес и еще больше малый, потому что последнему ой как надо бы эффективно расти. Уже потому, что этого бизнеса очень много и он крутит экономику и рождает новые экономические ниши. Вот сколько бизнеса
К концу декабря 2023 года в Едином реестре субъектов малого и среднего предпринимательства ФНС насчитывается 6,31 млн субъектов малого и среднего предпринимательства (МСП) против 5,97 млн годом ранее. Количество сотрудников в таких компаний за тот же период снизилось с 15,1 млн до 15,2 млн человек.
Причём этих компаний тупо больше. Экономическая рентабельность хорошей аналитики тут сильно выше.
Куда идти дальше
Пост был про то, что выпускники, когда приходят заниматься аналитикой не врубаются в среду, в которой они работают и применяют общие подходы только потому, что их научили пользоваться инструментами.
Поэтому всё к тому, что в рамках образования аналитика надо больше времени уделить очень конкретным бизнес-задачам. А как взять эти задачи? Начать с бизнес-теории, маркетинговой теории, теории разработки продукта. Так аналитики научнут понимать, что они анализируют и превратят свою работу в увлекательное исследование, а не беконечное конструирование дашбордов.
Заключение
Ну и искромётное из моего филологического прошлого...
Каждый писатель - исследователь действительности. И хорош он только тогда, когда понимает, о чём пишет.