{"id":14271,"url":"\/distributions\/14271\/click?bit=1&hash=51917511656265921c5b13ff3eb9d4e048e0aaeb67fc3977400bb43652cdbd32","title":"\u0420\u0435\u0434\u0430\u043a\u0442\u043e\u0440 \u043d\u0430\u0442\u0438\u0432\u043e\u043a \u0438 \u0441\u043f\u0435\u0446\u043f\u0440\u043e\u0435\u043a\u0442\u043e\u0432 \u0432 vc.ru \u2014 \u043d\u0430\u0439\u0434\u0438\u0441\u044c!","buttonText":"","imageUuid":""}

Хакатон с «женским лицом»: СберМаркет и McKinsey привлекают девушек в Data Science

Осенью СберМаркет провел хакатон совместно с McKinsey по теме Data Science. Особенностью мероприятия стало то, что в состав участников вошли представительницы только прекрасного пола из разных стран. Иван Леонтьев, финансовый аналитик в команде СберМаркета, рассказывает о том, как все прошло.

Одна из приглашенных гостей - Эмили Драль, всемирно известная эксперт в Data Science

Почему именно для девушек

Next Generation Women Leaders (NGWL) — глобальная инициатива McKinsey, направленная на поддержку и привлечение талантливых девушек. Идея NGWL хакатона - в привлечении и поддержке девушек, заинтересованных в IT и Data Science в частности, потому что женская аудитория в индустрии DS пока что невелика.

В 2020 году для участия в хакатоне зарегистрировалось 700 девушек. Отбор на финальный этап прошли 150 участниц из 41 команды. Нас также очень порадовало разнообразие стран, из которых регистрировались девушки - хакатон объединил участниц из 23 стран!

Как зарождался хакатон

Подготовка нашего хакатона строилась на двух важных принципах: планирование и четкое разделение обязанностей. McKinsey и PhystechGenesis взяли на себя пиар, отбор участниц, отрисовку сайта и логотипов. Также, совместно со СберМаркетом, все компании-организаторы проверяли решения и участвовали в вынесении окончательного вердикта.

Организация контентной части мероприятия и постановка задачи лежала на плечах команды СберМаркета. Мы должны были подготовить данные, бэйзлайн-решение модели, презентацию о СберМаркете и соревнование на kaggle. Дополнительно нами созданы схема данных для более быстрой адаптации участниц, а также Google Docs с ответами на часто задаваемые вопросы. Кроме того, мы объединили техническую часть (предсказание оттока) и бизнес-задачу (определение концепции оттока). И конечно, каждый день хакатона был распланирован до мелочей (пришлось разделиться по ролям, чтобы постоянно от нас было хотя бы 6 человек, которые могли бы подключаться на чекпоинты и предоставлять обратную связь участницам).

Слайд из презентации команды The Glorious Chargers

Сложность хакатона заключалась именно в том, что он объединял техническую часть и решение бизнес-задачи. Девушкам предстояла сложная работа: основываясь на реальных данных о заказах и истории коммуникации с пользователями СберМаркета, провести исследование, создать модель удержания наших клиентов, найти способы повышения их лояльности и предсказать потребительское поведение в это нестабильное время.

Что нового

Как было сказано выше, наш хакатон в равной доле совместил бизнес-задачу и техническую часть. В первом случае участницам предлагалось придумать концепцию оттока, ввести новые метрики, найти инсайты в данных и дать по ним рекомендацию (что следует изменить в сервисе), сделать прототипы и презентацию. Во втором – девушкам было необходимо предсказать отток в простом виде, как мы его задали. Кроме того, мы разнообразили его и ввели дополнительные, не оцифровываемые критерии, чтобы более явно разделить команды с похожим скором модели.

Слайд из презентации команды HackIT

Задача была очень объемная для 1,5 дней. Нам очень помогло то, как мы организовали свою работу. Весь процесс был разделен на спринты, после которых наша команда обсуждала, что удалось сделать за прошедшее время.

Мы арендовали кабинет в антикафе и 12 часов работали вместе. Дальше все разошлись по домам, продолжив заниматься своими задачами. Мы удаленно вели совместные доски в Trello и Miro, периодически собирались в Zoom — это все позволяло держать фокус сразу на нескольких задачах хакатона. Я была нацелена на достойный результат, поэтому мысли бросить все не было. Ну, может только когда в 7 утра зазвонил будильник, а разошлись мы около 5. За минуту до окончания соревнования на kaggle мы поднялись на 3 место в лидерборде, что, конечно, придало нам сил.

Главное, что я для себя вынесла — неважно, насколько хорошо команда сработана, в приоритете – быстро понять сильные стороны каждого участника и, исходя из этого, распределять задачи между людьми. Не нужно бояться просить помощи или делегировать обязанности. И, конечно, не стоит забывать про тайм-менеджмент.

Дарья Полежаева, капитан команды-победителя HackIt

Итоги хакатона

Мероприятие прошло продуктивно: мы получили интересные инсайты, несколько хороших моделей, основанных на разбиении пользователей на сегменты, и целостную концепцию оттока пользователей через LTV. Дополнительно мы прорекламировали наш бренд, а также сделали чек-лист как провести хакатон гладко, не допустить проблем и ликов в данных.

Призовые места распределились следующим образом:

  • 1 место — «HackIt» (Модель предсказания оттока на 1 месяц вперед. Главная идея — удерживать не всех клиентов, склонных к churn).
  • 2 место — «Glorious Chargers» (Персонализированный data-driven маркетинг. Идея – к вероятности оттока клиентов рассчитывать потенциальную упущенную выгоду).
  • 3 место — «Здравствуйте, это служба безопасности Сбербанка». (Регрессионная модель предсказания ожидаемых потраченных денег для каждого кластера пользователей, при значительном отклонении клиента от своего прогноза – оказание воздействия. За основу берется не фиксированный, а индивидуальный временной интервал).
  • Приз симпатий жюри за отличную идею на стыке DS и бизнеса досталась команде «Unexpected Error» (Определение порога отсечения клиентов по вероятности, формирование персональных предложений для склонных уйти в отток).

Хакатон — это не только место, где генерируются идеи и создаются новые продукты. По мнению Натальи (команда «HackIt»), это возможность посмотреть на работы других команд, получить больше опыта и узнать необычные подходы к решению задач. Кроме того, на таком мероприятии можно познакомиться с интересными людьми, обменяться визитками и продолжить общение.

Чек-лист, как организовать идеальный хакатон:

1. Подготовить данные и сделать все возможное, чтобы не произошло утечки: зашифровать все ID, удалить имена, персональные данные, а также информацию, даже косвенно указывающую на человека или адрес.

2. Сопоставить подготовленные данные друг с другом. Для этого необходимо, чтобы таблицы были связаны между собой и имели адекватные названия. Можно создать схему (например, в Miro), которая позволит проверить данные, их связи организаторами и существенно облегчит вход в хакатон участницам. Вот как сделали ее мы.

3. Сделать описание интуитивно понятным. Помните, что сложность хакатона заключается в бизнес-идее и модели, а не в том, как долго участницы будут пытаться понять смысл полей.

4. Собрать все ссылки в одном месте (например, в презентации или закрепленном сообщении).

5. Ввести максимально четкое определение базовых метрики, чтобы у участниц было четкое понимание, что нужно предсказать.

6. Заранее определить не оцифровываемые критерии для оценки команд и сделать алгоритм приведения точности модели и субъективных оценок жюри к одной системе баллов.

7. Пригласить лучших спикеров, которые могли бы поделиться ценным опытом с молодыми специалистами.

8. Подготовить свою айдентику и мерч для победителей хакатона.

9. Во время мероприятия максимально быстро и полно отвечать на вопросы участников.

0
1 комментарий
Василий Степанов

Data Science в опасности, пацаны.

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда