Хакатон с «женским лицом»: СберМаркет и McKinsey привлекают девушек в Data Science
Осенью СберМаркет провел хакатон совместно с McKinsey по теме Data Science. Особенностью мероприятия стало то, что в состав участников вошли представительницы только прекрасного пола из разных стран. Иван Леонтьев, финансовый аналитик в команде СберМаркета, рассказывает о том, как все прошло.
Почему именно для девушек
Next Generation Women Leaders (NGWL) — глобальная инициатива McKinsey, направленная на поддержку и привлечение талантливых девушек. Идея NGWL хакатона - в привлечении и поддержке девушек, заинтересованных в IT и Data Science в частности, потому что женская аудитория в индустрии DS пока что невелика.
В 2020 году для участия в хакатоне зарегистрировалось 700 девушек. Отбор на финальный этап прошли 150 участниц из 41 команды. Нас также очень порадовало разнообразие стран, из которых регистрировались девушки - хакатон объединил участниц из 23 стран!
Как зарождался хакатон
Подготовка нашего хакатона строилась на двух важных принципах: планирование и четкое разделение обязанностей. McKinsey и PhystechGenesis взяли на себя пиар, отбор участниц, отрисовку сайта и логотипов. Также, совместно со СберМаркетом, все компании-организаторы проверяли решения и участвовали в вынесении окончательного вердикта.
Организация контентной части мероприятия и постановка задачи лежала на плечах команды СберМаркета. Мы должны были подготовить данные, бэйзлайн-решение модели, презентацию о СберМаркете и соревнование на kaggle. Дополнительно нами созданы схема данных для более быстрой адаптации участниц, а также Google Docs с ответами на часто задаваемые вопросы. Кроме того, мы объединили техническую часть (предсказание оттока) и бизнес-задачу (определение концепции оттока). И конечно, каждый день хакатона был распланирован до мелочей (пришлось разделиться по ролям, чтобы постоянно от нас было хотя бы 6 человек, которые могли бы подключаться на чекпоинты и предоставлять обратную связь участницам).
Сложность хакатона заключалась именно в том, что он объединял техническую часть и решение бизнес-задачи. Девушкам предстояла сложная работа: основываясь на реальных данных о заказах и истории коммуникации с пользователями СберМаркета, провести исследование, создать модель удержания наших клиентов, найти способы повышения их лояльности и предсказать потребительское поведение в это нестабильное время.
Что нового
Как было сказано выше, наш хакатон в равной доле совместил бизнес-задачу и техническую часть. В первом случае участницам предлагалось придумать концепцию оттока, ввести новые метрики, найти инсайты в данных и дать по ним рекомендацию (что следует изменить в сервисе), сделать прототипы и презентацию. Во втором – девушкам было необходимо предсказать отток в простом виде, как мы его задали. Кроме того, мы разнообразили его и ввели дополнительные, не оцифровываемые критерии, чтобы более явно разделить команды с похожим скором модели.
Итоги хакатона
Мероприятие прошло продуктивно: мы получили интересные инсайты, несколько хороших моделей, основанных на разбиении пользователей на сегменты, и целостную концепцию оттока пользователей через LTV. Дополнительно мы прорекламировали наш бренд, а также сделали чек-лист как провести хакатон гладко, не допустить проблем и ликов в данных.
Призовые места распределились следующим образом:
- 1 место — «HackIt» (Модель предсказания оттока на 1 месяц вперед. Главная идея — удерживать не всех клиентов, склонных к churn).
- 2 место — «Glorious Chargers» (Персонализированный data-driven маркетинг. Идея – к вероятности оттока клиентов рассчитывать потенциальную упущенную выгоду).
- 3 место — «Здравствуйте, это служба безопасности Сбербанка». (Регрессионная модель предсказания ожидаемых потраченных денег для каждого кластера пользователей, при значительном отклонении клиента от своего прогноза – оказание воздействия. За основу берется не фиксированный, а индивидуальный временной интервал).
- Приз симпатий жюри за отличную идею на стыке DS и бизнеса досталась команде «Unexpected Error» (Определение порога отсечения клиентов по вероятности, формирование персональных предложений для склонных уйти в отток).
Хакатон — это не только место, где генерируются идеи и создаются новые продукты. По мнению Натальи (команда «HackIt»), это возможность посмотреть на работы других команд, получить больше опыта и узнать необычные подходы к решению задач. Кроме того, на таком мероприятии можно познакомиться с интересными людьми, обменяться визитками и продолжить общение.
Чек-лист, как организовать идеальный хакатон:
1. Подготовить данные и сделать все возможное, чтобы не произошло утечки: зашифровать все ID, удалить имена, персональные данные, а также информацию, даже косвенно указывающую на человека или адрес.
2. Сопоставить подготовленные данные друг с другом. Для этого необходимо, чтобы таблицы были связаны между собой и имели адекватные названия. Можно создать схему (например, в Miro), которая позволит проверить данные, их связи организаторами и существенно облегчит вход в хакатон участницам. Вот как сделали ее мы.
3. Сделать описание интуитивно понятным. Помните, что сложность хакатона заключается в бизнес-идее и модели, а не в том, как долго участницы будут пытаться понять смысл полей.
4. Собрать все ссылки в одном месте (например, в презентации или закрепленном сообщении).
5. Ввести максимально четкое определение базовых метрики, чтобы у участниц было четкое понимание, что нужно предсказать.
6. Заранее определить не оцифровываемые критерии для оценки команд и сделать алгоритм приведения точности модели и субъективных оценок жюри к одной системе баллов.
7. Пригласить лучших спикеров, которые могли бы поделиться ценным опытом с молодыми специалистами.
8. Подготовить свою айдентику и мерч для победителей хакатона.
9. Во время мероприятия максимально быстро и полно отвечать на вопросы участников.
Data Science в опасности, пацаны.