РН-БашНИПИнефть

Держим курс на курсы, или Машинного обучения много не бывает

Первый курс по машинному обучению от ООО "РН-БашНИПИнефть" прошёл на базе УГАТУ

Говорят, хочешь что-то сделать хорошо, сделай это сам.

Хочешь получить себе в штат классного специалиста по машинному обучению? Обучи его всему необходимому сам.

Не чужды народной мудрости и специалисты научного института – ООО «РН-БашНИПИнефть». В начале этого года они подготовили первый – дебютный, так сказать – курс для студентов по машинному обучению (ML – (англ.) machine learning). Но не просто очередной курс, коих море на просторах Интернета, а адаптированный курс под задачи, которые будет решать будущий датасайнтист в научном институте.

Кто-то спросит: «А что это такое – «машинное обучение»?» Мы ответим: «Это класс методов искусственного интеллекта, характерной чертой которых является не прямое решение задачи, а обучение в процессе применения решений множества сходных задач» (Вики). По сути, это поиск взаимосвязей в большом объёме данных, поиск скрытых закономерностей с помощью различных методов математической статистики, теории вероятности, численных методов.

Специалисты института рассматривают машинное обучение и анализ данных как область науки на стыке математики и информатики, которая служит для разработки специализированных математических методов и вычислительных алгоритмов. Эти алгоритмы предназначены для извлечения знаний из представленных массивов данных с целью принятия решений относительно рассматриваемых объектов.

Это направление работы – обучение компьютерных «мозгов» – институт Роснефти активно развивает уже два года. Спецами был пройден путь от команды энтузиастов, создающих прототипы программных продуктов, до самостоятельного подразделения, демонстрирующего примеры внедрения решений с использованием моделей машинного обучения в корпоративную линейку наукоёмкого программного обеспечения для решения производственных задач.

Идея создать «внешний» (= не для сотрудников) курс пришла Рафаилу Газизову, который совмещает работу в институте с работой завкафа в Уфимском государственном авиационном техническом университете (УГАТУ). В 2018 году Рафаил Кавыевич был в числе организаторов первого студенческого хакатона «Роснефти» по машинному обучению. Целью курса было не только познакомить участников с основами машинного обучения, но и показать подходы к решению реальных производственных задач.

Рафаил Газизов, заместитель начальника Управления развития информационных технологий «РН-БашНИПИнефть», заведующий кафедрой высокопроизводительных вычислительных технологий и систем УГАТУ:

«На хакатоне мы предложили студентам решить прикладную задачу с реальными исходными данными, далёкими от идеального качества (например, при прохождении различных курсов по ML в основном предоставляются, так сказать, «хорошие» данные). Большинство студентов не смогли «побить» базовое решение из-за отсутствия навыков решения реальных задач, а не синтетических. Вот тогда-то стало ясно, что студентам для начала необходимо показать, КАК НАДО подходить к решению прикладных задач в нефтяной отрасли».

До конца марта курс по машинному обучению проходил в очном формате, затем стал дистанционным

Четырёхмесячный курс по ML для студентов уфимских вузов разрабатывала команда сотрудников «РН-БашНИПИнефть». Это не профессиональный педагогический коллектив и даже не кружок педагогов-любителей, поэтому сотрудникам научного института пришлось немного «прокачать» себя, чтобы курс получился действительно обучающим (= полезным). Даже заслуженный-презаслуженный педагог готовит план урока, что уж говорить о тех, кто только начинает нести свет знаний другим!

В феврале в аудитории УГАТУ собрались студенты технических вузов (тогда ещё можно было собраться большим скоплениям людей). На стартовое занятие пришли 98 студентов. Организаторы все четыре месяца вели рейтинг, в который вошли 78 студентов, сдавших хотя бы одно домашнее задание. Да-да, без любимой «домашки» тут никак.

Курс состоял из четырёх модулей: «Что такое машинное обучение», «Анализ и визуализация данных с Pandas», «Нейронные сети», «Ансамбли моделей». Обучение длилось с февраля по май, в марте (когда президент РФ объявил всеобщий домашний режим) оно благодаря стриминговому сервису Youtube благополучно переехало в онлайн.

В июне среди слушателей было проведено онлайн-соревнование на https://hack.rn.digital/: решали задачу по прогнозированию запускных дебитов жидкости после проведения ИДН (интенсификации добычи нефти) с использованием массива исторических данных. Соревнование проводилось на собственной платформе (всё по-взрослому), которую адаптировали специально к курсам со своим лидербордом и автоматическим расчётом метрики качества полученных моделей. В итоге сертификат о прохождении обучения по ML получили 29 слушателей (это те, кто выполнил более 60% домашних заданий). Все ребята, принявшие участие в соревновании по итогам курса, можно сказать «закалились» перед первым из хакатонов марафона «Роснефти», который состоится в конце сентября.

Айрат Азбуханов, начальник отдела прототипов и развития технологий «РН-БашНИПИнефть», подвёл итоги от лица организаторов курса:

«Преимущественно наш курс прошёл в дистанционном формате, что оказалось весьма комфортным для лекторов: мало отвлекающих факторов, удобно следовать чёткой структуре занятия, следить за временем. Единственное – не хватало обратной связи от студентов, их «горящих глаз». Не всегда было понятно, сколько человек действительно слушают лекцию. В целом преподаватели курса сошлись во мнении, что среди слушателей есть перспективные студенты, которых однозначно стоит пригласить на практику. Так как «РН-БашНИПИнефть» является специализированным институтом «Роснефти» по прикладному программному обеспечению, мы хотим стать центром компетенции в области применения методов машинного обучения в компании в целом. Но мы понимаем, что без постоянного притока молодых кадров нам не осуществить наши довольно амбициозные планы. Поэтому в условиях постоянного дефицита кадров было решено самостоятельно обучать будущих специалистов для института и для компании».

Так как дебютный курс по машинному обучению для студентов прошёл успешно, у научного института Роснефти теперь появилась великая цель – трансформировать образовательный курс в специализированный – в области нефтяного хозяйства. Организаторам хочется увеличить охват аудитории, чтобы курс стал широкодоступным.

Лучшие слушатели получили сертификат об успешном завершении курса и о пребывании в топ-5 рейтинга итогового соревнования

Владислав Кулеш, слушатель курса, ТОП-5 рейтинга:

«Я по образованию инженер-нефтяник, и до того, как поступил на данный курс, не был как-то связан с ИТ-сферой. Пришел в неё случайно. Слушал лекцию по экономике в университете, и преподаватель сказала нам: «Чтобы быть востребованным в современной нефтяной промышленности, вы обязаны знать, что такое Data Science, иначе никак». И почему-то эти слова меня очень задели, и я стал углубляться в эту сферу. По счастливой случайности в коридоре нашего универа я увидел объявление, что специалисты «РН-БашНИПИнефть» помогут с нуля начать разбираться в очень обширной сфере под названием Data Science. Звёзды сошлись! И я записался на курс. В наше время быть просто хорошим специалистом в своем деле недостаточно. Умение программировать и проводить анализ данных сейчас необходимо во многих отраслях. Кроме того, в машинном обучении немаловажно понимать ту сферу, для которой создаётся модель. Так, например специалист по ML, имеющий образование в сфере разработки нефтяных и газовых месторождений, с большей вероятностью сможет создать качественную и достоверную модель для этой сферы. Теперь ещё мне осталось поучаствовать в марафоне ИТ-соревнований «Роснефти». Там как раз одно из соревнований посвящено машинному обучению. Считаю, это отличный шанс применить полученные знания на практике».

Никита Вакказов, слушатель курса, ТОП-5 рейтинга:

«Мне со школы нравилось IT-направление, поэтому решил поступать в университет на специальность, связанную с программированием. Объявление о курсе по машинному обучению подвернулось мне как раз, когда я искал себе такого рода обучение. После лекций, «домашки», соревнования мне кажется, что теперь я готов освоить более сложный материал. Мне понравилось, и я готов развиваться дальше».

Фидан Харрасов, слушатель курса, ТОП-5 рейтинга:

«IT-сфера – это моё. В школе мне нравились уроки информатики, на которых я пробовал делать простейшие сайты и программы, мне очень нравилось создавать что-то при помощи кода, и при поступлении в вуз выбрал именно IT-направление. О курсах по ML узнал через соцсети. Результатом обучения остался доволен, даже впервые поучаствовал в соревновании для слушателей курса и вошёл в пятёрку лидеров!»

P. S. Возможно, обратная связь от студентов, прошедших курс, и эта статья вдохновят и другие организации, заинтересованные в специалистах по машинному обучению, подумать над тем, чтобы разработать для студентов качественный обучающий модуль с привязкой к производственным процессам. Машинного обучения много не бывает!

0
Комментарии
Читать все 0 комментариев
null