Онлайн-хакатон от «Северстали» и McKinsey

Высокие технологии проникают во все отрасли бизнеса и промышленности, не исключая, конечно же, металлургию. Благодаря разным технологиям металлургические предприятия более эффективно используют ресурсы, мониторят качество продукции, улучшают показатель непрерывности процесса производства.

Но нет предела совершенству! Сейчас мы, ПАО «Северсталь», совместно с McKinsey и при поддержке Russian Hackers решили провести онлайн-хакатон для аналитиков и разработчиков по поиску и анализу данных.

Общий призовой фонд хакатона - 700 000 рублей.

Онлайн-хакатон от «Северстали» и McKinsey

Кто может участвовать

Для участия в нашем хакатоне есть три условия:

● Во-первых, приглашаются разработчики и аналитики.

● Во-вторых, участвовать можно как одному человеку, так и командой до 5 человек.

● В-третьих, для получения приза в команде должен быть гражданин РФ старше 18 лет.

Тиммейтов можно поискать в чате хакатона в Telegram или в разделе «Поиск команды» на платформе регистрации. Кроме того, помочь могут и организаторы.

Важный момент — для работы не нужен мощный ноутбук или ПК. Вполне достаточно рабочего ПК и выхода в интернет. Участвовать можно из любой точки мира.

Задачи для участников

Мы подготовили четыре задачи для участников хакатона.

Задача 1. Управление ликвидностью

Суть задачи:

● Провести исследование данных по затратам на Энергоресурсы за несколько лет, проанализировать возможности обогащения внешними данными, определить значимые факторы влияния, построить прогнозную модель с пошаговым разъяснением принципов построения.

● На выходе – понятный как для аналитика, так и для бизнес-пользователя Jupyter Notebook с подробным Exploratory Data Analysis (EDA).

Ключевые вопросы участникам:

● Какие закономерности движения денежных потоков в разрезе балансовых единиц удалось выделить в результате EDA? Какие связи были найдены при исследовании?

● Можно ли предположить, в какие дни будут происходить транзакции в будущем? Проверьте свои результаты на имеющихся данных, какой МАРЕ у вас получился?

● Попробуйте составить график движения денежных средств на основе выявленных закономерностей на 1-2 квартал 2021 года (будет предложен пример).

● Какие данные могли бы, на ваш взгляд, помочь построить более точный прогноз? Предложите схему сбора новых данных: частота, гранулярность и другие необходимые параметры. Отразите в презентации, как вы предполагаете использовать эти данные для решения задачи.

Почему это важно в продакшне:

● Северсталь непрерывно улучшает качество планирования, что дает возможности более эффективно распределять финансовые ресурсы и экономить на финансовых затратах.

● Наша задача на этом хакатоне – найти инсайды для увеличения точности прогноза доходов и расходов по статьям ликвидности.

Задача 2. Мониторинг цен

Суть задачи:

● Разработать инструмент, помогающий специалисту планировать цену на закупку запасных частей к спец. техники.

● Подойти к задаче творчески: создать инструмент прогнозирования в будущем, либо «сервис-шпаргалку» пользователю с анализом конкретных товаров и вариантов определения цен (should cost model).

● В задаче предстоит разработать принципы алгоритмического мэппинга имён и характеристик товаров, исследовать зависимость между данными.

● На выходе – воспроизводимый код и презентация сервиса.

Ключевые вопросы участникам:

● Вы разработали инструмент, который позволит специалисту на основе внутренних и внешних факторов планировать цену на закупку. Расскажите, какие внешние данные вам удалось собрать? Как, на ваш взгляд, эти данные могут повлиять на планирование и мониторинг цен на товары?

● Как будет выглядеть процесс использования инструмента для специалиста по планированию? Опишите бизнес-процесс с иллюстрациями.

● Разработанный инструмент должен позволять визуализировать данные по товарам, так и выгружать данные в excel для «быстрого» построения отчета. Продемонстрируйте варианты информативной визуализации и подготовьте код для формирования отчета, а также пример отчета.

● Каких внутренних данных не хватает для улучшения качества планирования?

Почему это важно в продакшне:

● Северсталь массово обрабатывает десятки товарных групп при планировании бюджетов на закупку, для увеличения скорости и точности обработки рассматривается альтернативный сценарий планирования цен на закупку по наиболее популярным категориям товаров с использованием алгоритмов, основанных на поиске данных.

Задача 3. Автоматический поиск поставщиков

Суть задачи:

● Задача состоит из нескольких блоков:

1) разработка алгоритма для парсинга товаров

2) исследование возможных данных во внешних источниках

3) разработка программы подготовки информации в требуемом разрезе (товар vs поставщик vs рейтинг поставщика)

● На выходе – воспроизводимый код и презентация сервиса.

Ключевые вопросы участникам:

● Опишите ваше решение в таком разрезе: список найденных факторов, алгоритм поиска этих факторов во внешней среде, критерии ранжирования по ним контрагентов в связке с каждым товаром (возможно, не все факторы релевантны всем товарам). Опишите бизнес-процесс с иллюстрациями.

● В рамках вашего решения должна быть дополнена информация о контрагенте, принадлежащем к номенклатуре, в частности это может быть: ИНН/КПП, юр.адрес, статус, фин.показатели, отзывы о компании и др.

● Какие инсайты по поиску информации о поставщиках и подходы для проведения ранжирования вы нашли?

● Разработанный инструмент должен позволять визуализировать данные по поставщикам с привязкой (с учетом ранжирования) к товарам.

Почему это важно в продакшне:

● Автоматизация процесса поиска, первичной проверки и базового ранжирования поставщиков в разрезе каждой товарной группы – задел в сторону дополнительной прозрачности в принятии решений по закупкам и упрощения бизнес-процесса.

Задача 4. Анализ контрагентов

Суть задачи:

● Провести исследование имеющихся данных и попробовать спрогнозировать просрочку по контрагенту, предложить, как обогатить модель иными данными.

● На выходе – понятный как для аналитика, так и для бизнес-пользователя Jupyter Notebook с подробным Exploratory Data Analysis (EDA) и воспроизводимым кодом решения, предобработки, моделирования, а также выводами.

● С нас — данные по контрагентам за 2 года, список показателей для анализа, выборка для обучения модели.

Ключевые вопросы участникам:

● Вам представлены данные за разные годы с различным набором информации. Проведите EDA, постарайтесь определить и визуализировать взаимосвязи и выделите самые значимые факторы, опишите свои выводы.

● Возможно ли на данных за предыдущие годы спрогнозировать по контрагенту на следующий год: a) факт просрочки; б) просрочку более 30 дней; с) просрочку в диапазоне от 60 до 90 дней?

● Какие дополнительные данные можно было бы добавить для повышения точности прогноза?

Почему это важно в продакшне:

● Повышение точности прогнозирования просрочек позволяет более точно планировать доходность и возможные риски.

Когда можно приступать?

Подать заявкуможно по этой ссылке до 8 марта. Нужно заполнить анкету, создать команду и пригласить единомышленников или же участвовать самостоятельно.

С 22 февраля по 8 марта пройдёт отборочный этап, нужно будет отправить решение одной из четырёх предложенных задач. 14 марта мы объявим итоги отбора.

Финальный этап хакатона пройдёт 18-20 марта. Финалисты смогут доработать свои решения бок о бок с бизнесом. В течение этого этапа команды участвуют в онлайн чек-поинтах с экспертами и загружают итоговое решение на платформу регистрации.

20 марта все финалисты приглашаются на питчи своих решений в офис. Можно будет выступить онлайн. После оглашения результатов планируется награждение, афтерпати и нетворкинг в офисе при участии экспертов Северстали и McKinsey.

Что получают участники?

Призовой фонд включает как денежные призы, так и мерч:

● 700 000 рублей — общий призовой фонд хакатона.

● 4 приза по 100 тыс. за лучшее решение каждого трека

● 200 тыс. получит лучшее решение всего хакатона, а 100 тыс. — лучшее решение по версии участников.

● 160 наборов мерча получат участники по итогам отборочного этапа.

● 5 плюшевых маскотов уйдут победителям конкурса.

Что же, осталось только зарегистрироваться по ссылке и принять участие. Дополнительную информацию можно получить на сайте хакатона или вTelegram-чате.

11
1 комментарий

Здравствуйте, у меня вопрос по этой публикации https://vc.ru/severstal/164109-vera-v-neyroseti-severstal-uluchshila-reshenie-dlya-poiska-i-klassifikacii-defektov-metalla

"Очередная собственная разработка компании получила название VERA. Это усовершенствованная версия EVE, способная находить уже 19 классов дефектов и имеющая более сложную архитектуру."

Здравствуйте, а есть возможность получить доступ к датасету, где вы классифицируете 19 типов дефектов? Что звучит гораздо весомее, чем 4 класса, как предыдущем датасете. Я являюсь студентом магистратуры и делаю исследования в этой области, поэтому это чисто для образовательных целей, соответствующий статус смогу подтвердить. Спасибо