Чего хотят женщины, как татуировки влияют на успешность игроков NBA и другое: результаты хакатона Digital Leader

О том, почему мы выбрали именно такой формат и дали участникам полную свободу, как стали невольными свидетелями детективной истории и чему научились во время проведения хакатона.

Одна из целей Digital Leader – формирование профессионального диджитал-комьюнити. Мы объединяем крутых профи, которые готовы поделиться своим опытом, и создаем экосистему для развития технологий. В этот раз мы решили пойти дальше и взять на себя большое виральное событие в области Data Science. Так появилась идея провести хакатон.

Первое мероприятие такого формата прошло с 19 октября по 27 ноября 2020 года. Подать заявку на участие в хакатоне мог любой желающий. Участникам предлагалось использовать свои навыки работы с данными для создания необычной аналитики – смешной, вызывающей, оригинальной. Нужно было самому найти нестандартные данные и визуализировать их. Работы оценивал экспертный совет, также на странице мероприятия было размещено открытое голосование, в котором могли принять участие все пользователи, авторизовавшиеся через любую социальную сеть. Автор лучшей работы должен был получить денежный приз и приглашение на реальные проекты в Data Science.

Мы выбрали именно такую механику проведения конкурса, потому что хотели сделать событие виральным и поставить перед участниками максимально нестандартную задачу, которая заставила бы их мыслить out of the box. В конкурсе могли принять участие не только дата-сайентисты, но и люди других профессий, потому что ключевым принципом была не техническая сложность работы, а неординарный подход и оригинальная визуализация результата.

На хакатон зарегистрировались более 200 участников, а до финала дошли только 12 проектов. Эксперты предположили, что основным препятствием для участников стало отсутствие конкретной задачи и предоставленных для анализа данных. Возможно, некоторых смутило, что необходимо придумать виральный, креативный проект.

Роман Бунин, руководитель команды визуализации, Яндекс Go, автор блога @revealthedata: «Открытая задача с целью развлечь – сложная цель, до которой немногим удалось дойти. Кажется, что аудитория такого хакатона – это больше дата-журналисты, чем дата-сайентисты. Из-за этого, на мой взгляд, получилось небольшое количество работ в финале».

Большое количество работ было посвящено взаимоотношениям: ребята пытались выяснить, чего хотят женщины, как климат влияет на количество свадеб и разводов, как строятся отношения в коллективе ИТ-компании. Были и неожиданные гипотезы – одна из участниц хакатона решила найти зависимость успеха команды в NBA от доли игроков с татуировками.

После предоставления участниками всех работ началось голосование на сайте. Работы оценили более полутора тысяч зрителей, с первых часов голосования несколько участников вырвались вперед.

Не обошлось и без детективной истории: в последний день голосования на сайт хакатона была совершена хакерская атака, и мы заметили резкий прирост голосов у одного из участников. Было решено провести экстренно расследование, в ходе которого выяснилось, что за одного из участников кто-то организовал платную накрутку голосов. Ситуация стала еще более запутанной, когда мы связались с этим участником и выяснили, что он был не в курсе этой истории, и за накруткой стоял его брат, с которым они уже давно не общаются. Пожалуй, этот сюжет подходит для детективного романа, а не для поста про хакатон.

По результатам расследования было решено досрочно завершить голосование и учитывать только те голоса, которые были отданы зрителями до атаки на сайт. Мнение голосующих совпало с мнением экспертного совета, поэтому нам было несложно выбрать трех финалистов.

Святослав Зборовский, работа «Thank you points: социальные связи внутри ИТ-компании»

Работа Святослава представляет визуализацию социальных связей внутри ИТ-компании, в которой он работает. В организации есть своя внутренняя валюта – thank you points или типсы, которые выдают сотрудникам каждый месяц за какие-либо активности, публикации и участие в вебинарах. Святослав проанализировал данные о том, кто и кому дарил эти типсы в компании и построил инфографику на основе результатов анализа.

Святослав Зборовский: «Когда я стал смотреть интересные открытые данные в Интернете, я понял, что по ним уже все придумано. И тут я решил рассказать про такое интересное социальное явление, как типсы или thank you points. Я работаю в ИТ, и как во многих ИТ-компаниях у нас распределенные команды – коллеги работают из разных городов и стран. И вот когда коллеги так далеко друг от друга и общаются онлайн, как отследить их взаимоотношения? Наше руководство придумало внутреннюю валюту – thank you points. В своей работе я попытался отследить самые крупные паттерны дарения типсов».

Роман Бунин, руководитель команды визуализации, Яндекс Go, автор канала @revealthedata: «Сетевой граф – очень распространенный вид визуализации, но при этом он часто используется для красоты, а не для получения инсайтов. Часто сложно сделать какие-то выводы, глядя на эту визуализацию. Здесь же автору удалось совместить графически аккуратную работу с интересными выводами, которые очень наглядно видны на этой визуализации».

Святослав Зборовский, работа «Thank you points: социальные связи внутри ИТ-компании»
Святослав Зборовский, работа «Thank you points: социальные связи внутри ИТ-компании»

Олег Наумов, работа «Количество ДТП с участием велосипедов в Москве»

Олег взял данные с платформы https://dtp-stat.ru, на которой отображены дорожно-транспортные происшествия, и проанализировал количество ДТП с участием велосипедистов за период с 2015 года и по август 2020. Итоговый график, стилизованный под старую, знакомую многим игру «Gravity defied», показывает, что в зимние периоды катание на велосипеде статистически (но не практически) безопаснее, чем в летнее.

Олег Наумов, работа «Количество ДТП с участием велосипедов в Москве»
Олег Наумов, работа «Количество ДТП с участием велосипедов в Москве»

Юлия Сидельникова, работа «Чего хотят женщины?»

Юлия взяла за основу данные, полученные во время эксперимента, проводившегося в 2002-2004 годах. Участниц быстрых свиданий попросили оценить самые важные на их взгляд качества у мужчин до свидания, а затем после него.

Юлия Сидельникова: «Я решила рассмотреть корреляцию ответов женщин до и после. Для наглядного отображения результатов опроса, я построила лепестковую диаграмму опираясь на эти данные. На диаграмме видно, как менялись их предпочтения, если до свидания они выделяли три характеристики - ум, искренность и привлекательность, то после свидания это были - привлекательность и чувство юмора».

Юлия Сидельникова, работа «Чего хотят женщины?»
Юлия Сидельникова, работа «Чего хотят женщины?»

Роман Бунин, руководитель команды визуализации, Яндекс Go, автор канала @revealthedata: «Я бы посоветовал участникам будущих хакатонов искать больше референсов и похожих работ для вдохновения. Если речь идет о задаче вовлечь или развлечь пользователя – то, возможно, стоит идти не от данных, а от идеи, как это можно реализовать, что несвойственно обычной бизнесовой аналитике».

Изначально мы планировали выбрать одного победителя и вручить ему денежный приз, а двум остальным финалистам подарить памятные подарки. Но в результате того, что в голосование вмешались хакеры, и нам пришлось его досрочно прекратить, было принято решение разделить деньги поровну между тремя финалистами.

Вместе с руководителем направления антиконтрафакта департамента защиты бренда компании Group-IB Яковом Кравцовым мы записали ролик, в котором подробнее рассказываем о нашем решении и о том, можно ли сделать голосование в Интернете прозрачным.

На следующих хакатонах мы предложим участникам реальные кейсы крупнейших ИТ-компаний и доверим выбор победителя экспертному совету.

1919
Начать дискуссию