Как Data Science может привести в нефтянку

История о том, как я поменял сферу деятельности, что послужило мотивацией, и как я попал в научный институт Роснефти.

Константин Сухарев на "Хакатоне трёх городов" (2020)
Константин Сухарев на "Хакатоне трёх городов" (2020)

Вместо введения

Если б несколько лет назад мне сказали: «Константин, ты будешь работать в Роснефти» – я б подумал, что буду проектировщиком или оператором на заводе. Да, у меня техническое образование, связанное с нефтяной отраслью. Но три года назад я понял, что меня неудержимо тянет в Data Science. И я решил попробовать перейти в новую сферу. Тогда я уже думал, что технические знания из университета мне больше не пригодятся.

Однако в один прекрасный момент – в момент поступившего мне предложения работы от научного института Роснефти – я понял, что сильно ошибался. А теперь по порядку...

Что-то пошло не так

В 2018 году я учился в аспирантуре и оказался на должности инженера в университете. Занимался там в основном рутинными вещами и бумажками. И эта работа вступала в резкий контраст с тем, что я видел, пока трудился на производстве лопаток газотурбинных двигателей (при этом успевал совмещать учебу в магистратуре). На производстве все стремились заработать или как минимум где-то сэкономить, улучшив или ничего не потеряв в характеристиках изделий. Приятно было осознавать, что все твои действия влияют на бюджет отдела, на зарплаты и премии.

Ещё по части мотивации – личный пример близкого родственника. Старший брат перешёл в айтишники. После пары месяцев работы на аутсоринговую компанию, он устроился фронтенд-разработчиком в крупный российский банк. Что и говорить, его зарплата отличалась на порядок от моейуниверситетской. И это вполне логично: высококвалифицированный труд, который приносит пользу компании, ценится больше, чем бумажная работа (которой может заниматься и человек без особо выдающихся способностей).

От аспирантуры у меня осталось смешанное впечатление. Что-то пошло не так. Возможно, я был плохим аспирантом, но как только я осознал, что тема диссертации не принесёт никому пользы, и она сама после написания пойдёт «в стол», возникло желание уйти из университета и взять академ в аспирантуре. Что я и сделал. Ушёл в никуда. При этом у меня была отложена сумма, чтобы не отказывать себе в базовых потребностях года три (да, на производстве лопаток платили хорошо).

Рекомендовать всем так делать не буду. Это скорее пример, как делать не надо. Но если очень хочется сменить сферу деятельности, то можно :).

Первые «успехи»

Ещё в аспирантуре меня как-то занесло сначала на курсы на Coursera по машинному обучению, а потом на совместное прохождение курса по DL от Carnegie Mellon University сообщества Open Data Science и на курс Юрия Кашницкого mlcourse.ai.

После этого меня ждал «успех» с соревнованием в конце курса на Stepik по компьютерному зрению одной корейской компании. Первые 10 мест с соревнования обещали позвать на собеседование. Я был десятый. Мне пришло письмо с приглашением на собеседование (без назначенного времени, просто приглашение) и просьбой скинуть резюме. Я обрадовался и отправил резюме. Прошла неделя. Тишина. Я решил напомнить о себе рекрутёру. Тут выяснилось, что резюме отклонил руководитель, собеседования не будет. Вот такой «успех».

Параллельно с прохождением разных курсов я пробовал подаваться на вакансии, опубликованные в Open Data Science (ODS – крупнейшее русскоязычное сообщество специалистов по машинному обучению и анализу данных). Проходил фильтры HR. Получал ответы: нужно подучиться или поделать свои проекты / поучаствовать в соревнованиях по машинному обучению. Опять мимо.

В то время меня посещали мысли, что я поспешил уволиться. Лучше хорошенько подумать, прежде чем повторять мой опыт.

Я участвовал в соревнованиях на Kaggle и даже получил бронзовую медаль в соревновании Instant Gratification, сделав большой ансамбль из разных моделей. Но бронза на Kaggle, как известно, не считается.

Мой путь в MADE

Спустя три месяца после увольнения я увидел где-то упоминание об Академии больших данных MADE от Mail.ru Group. И решил попробовать. Несмотря на предупреждение, что MADE для специалистов с опытом работы в ИТ.

Как Data Science может привести в нефтянку

Из релевантного опыта работы у меня было только программирование ПЛК на производстве и написание скриптов на Python для того, чтобы сконвертировать данные механических испытаний в нужный вид для статистической обработки. Всё остальное – различные курсы.

При поступлении с экзаменом по математике проблем не возникло. С заданиями по алгоритмам были трудности, я решил только 2 задачи из 4-x за отведённое время. С таким результатом не поступить, когда конкурс – 40 человек на место. В итоге меня выручило то, что кроме двух экзаменов при поступлении учитывались результаты вступительного соревнования по машинному обучению, где я занял 15-е место.

Поступил я на дистанционное обучение (я из Уфы) и выбрал специальность Data Scientist. Я по-прежнему нигде не работал, поэтому максимально вложился в учёбу. Кроме обязательных курсов по программированию на Python, алгоритмам и структурам данных, машинному обучению, я записывался на интересные мне дополнительные курсы по статистике, дизайну и планированию экспериментов, обработке естественного языка, компьютерному зрению, высокопроизводительным вычислениям, машинному обучению на графах и анализу социальных сетей. Даже взял курс по Big Data для Data Engineer.

Последний семестр получился особенно суровым. Во-первых, выпускные проекты приходилось совмещать с другими предметами. Во-вторых, я нашёл первую работу в Data Science (про это отдельный блок в конце статьи), и только тогда осознал, что испытывали все мои сокурсники, совмещая работу с учёбой.

Хакатон Роснефти и первая работа

В сентябре 2020 года РН-БашНИПИнефть – крупнейший научно-исследовательский институт Роснефти – проводил «Хакатон трёх городов», где нужно было разработать алгоритм для корреляции отражающих горизонтов. Среди участников было более 250 студентов и аспирантов (прим. ред.: таких активных, талантливых и амбициозных) в составе 52-х команд. Я чувствовал себя достаточно уверенно, чтобы участвовать в одиночку. Моя команда так и называлась – «Konstantin Sukharev».

Не делайте так! Не участвуйте в хакатонах в одиночку! У меня в конце голова кругом была, когда в последние минуты нужно было и презентацию сделать, и код решения подготовить для организаторов.

Команда «Konstantin Sukharev»
Команда «Konstantin Sukharev»

Первый день хакатона проходил на онлайн-площадке для проведения контестов. При этом организаторы вещали через прямую трансляцию на YouTube, а в перерывах между включениями там были результаты на публичном лидерборде.

Задачу на хакатоне можно было переформулировать и как регрессию, и как сегментацию, и даже как поиск кратчайшего пути в графе. Было перепробовано всё. Но машинное обучение работало не очень хорошо, так как организаторы предоставили для хакатона весьма ограниченное количество данных. Моё решение состояло из жадного алгоритма в 30 строк кода и было написано в последний час до конца хакатона. На публичном лидерборде я был 4-м, но после открытия приватного оказался на 3-м месте.

Второй день хакатона прошёл на площадках в Уфе, Казани и Самаре, куда была приглашена шестёрка лидеров рейтинга соревнования. И я в том числе. Мы очно встретились с членами жюри и представили экспертам презентации решений задачи соревнования. Ментор на хакатоне меня предупреждал, что жюри не очень «мемное». Но я всё равно в презентацию решения накидал мемов :) На сколько я могу судить, презентацию жюри оценило.

Выступление лидеров хакатона Роснефти перед экспертами
Выступление лидеров хакатона Роснефти перед экспертами

Во время презентации я немного растерялся, так как почему-то было включено автоматическое листание слайдов. Но это не страшно.

На церемонии награждения победителей познакомился с начальником отдела, который занимается Data Science проектами в РН-БашНИПИнефть. К слову, такие мероприятия – это как раз возможность нетворкинга с другими разработчиками и с организаторами. После хакатона, как один из финалистов, я сразу получил оффер. И с радостью принял. Процесс трудоустройства в РН-БашНИПИнефть прошёл достаточно быстро. Так я оказался в институте Роснефти. Конкретно этот научный институт осуществляет научно-техническое сопровождение деятельности нефтегазодобывающих предприятий Компании в области поиска, разведки, разработки и эксплуатации нефтяных и газовых месторождений, строительства скважин, технологий добычи нефти, проектирования обустройства нефтяных месторождений. И, что меня привлекло, занимается разработкой линейки наукоёмкого программного обеспечения для ключевых процессов нефтедобычи.

Ещё я порадовал бабушку с дедушкой, так как я устроился в Уфе и никуда не переезжаю :) Дело в том, что в Уфе почти нет компаний c DS вакансиями и мне, скорее всего, пришлось бы переехать в Москву. Я же остался с семьей и реализую свой потенциал в городе, где вырос, но на благо гиганта нефтянки.

Ну и стоило оно того?

Ещё как стоило. Интересная работа и хорошая зарплата. Много новых знакомств на соревнованиях и за время обучения. Чувство, что ты приносишь пользу обществу.

P.S.:

Участие в хакатонах и соревнованиях по машинному обучению позволяет выделиться среди кандидатов и устроиться на работу даже без опыта. Главное-желание, проактивная позиция и навыки, которые вырабатываются в процессе подготовки и «прокачки» себя и своих компетенций.

P.P.S.:

Следующее студенческое ИТ-соревнование Роснефти для программистов-робототехников состоится в начале ноября этого года... В конце ноября в Москве пройдёт финальное мероприятие – Rosneft Computer Vision Challenge – для ИТ-специалистов без возрастных ограничений. Мне как сотруднику научного института – организатора Марафона ИТ-соревнований – уже нельзя претендовать на призы. А вы можете!))

Я же теперь займу позицию наблюдателя и буду на «внутренней кухне» соревнований Роснефти.

Константин Сухарев

44
Начать дискуссию