Как мечты о космосе привели в МегаФон
Никита Козырев, недавний стажер акселератора big data МегаФона, рассказывает, как устроиться работать в крупную компанию, будучи студентом, что общего у машинного обучения и аэродинамики и куда приводят детские мечты.
За что меня взяли в МегаФон
Меня зовут Никита. Учусь на четвертом курсе Бауманки, а с шестого апреля тружусь в МегаФоне аналитиком и занимаюсь большими данными. Я получил эту работу, потому что целенаправленно к ней шел: учился, искал возможности и, главное, стажировался.
После окончания третьего курса я задумался о своей карьере и понял, что мне необходим опыт. Активно искал работу-стажировку, рассылал резюме по компаниям, принимал участие в отборах.
Я проходил курсы от МФТИ, когда один из студентов — Роман Васильев — рассказал мне о наборе на стажировку в МегаФон. Я решил написать рекрутеру Светлане Стакановой, прошел отбор и поступил в акселератор.
Как я дошел до машинного обучения
Как и многие дети, я мечтал строить ракеты и полететь в космос. Но, к сожалению, однажды понял, что космонавтом не стану: здоровье не то. Поступил в Бауманку и учился в космической сфере, проходил практику на военно-промышленном предприятии. Благодаря Бауманке я осознал, чем хочу заниматься на самом деле. Оказалось, что мне больше нравятся задачи, приближенные к реальной жизни, а не мечты об освоении далеких звезд.
В университете я учусь решать прикладные задачи в области вычислительной математики, механики и математической физики: проводить аэродинамические расчеты, моделировать новые материалы, композиционные материалы и наноструктуры, пишу диплом по теме «Восстановление параметров обтекания в возмущенной области и геометрии ударной волны около затупленного тела».
В работе я занимаюсь машинным обучением, и, хотя моя вузовская специальность кажется далекой от этой сферы, сходство все-таки есть, особенно в том, что касается математики.
Только не надо думать, что я отказался от детской мечты о ракетах. Просто моя работа — это реализация планов повзрослевшего человека.
Как я попал на стажировку
Когда я искал, где бы прокачать рабочие навыки, целенаправленно шел именно в машинное обучение. Формально с ML познакомился в институте: у нас был курс статистики и методов оптимизации, там я узнал, что можно делать при помощи машинного обучения, и понял, что мне это интересно.
Дальше был период самостоятельного освоения материала: читал статьи на «Хабре», брал курсы на Coursera (один из них по Python — основному языку для ML), реализовывал с нуля библиотеки, писал сайты.
Подготовка и поиск помогли наткнуться на акселератор МегаФона. Меня привлекли условия. На старте обещали обучение, возможное трудоустройство по итогам стажировки и зарплату. Это было круто, потому что любой труд должен быть оплачен, даже если ты еще студент и только проходишь «боевую подготовку».
А дальше я прошел два собеседования. Первое — теоретическое, тест по машинному обучению. Второе — практика: мне выдали метрики и набор обезличенных данных, необходимо было решить бизнес-задачу по классификации за три часа. Оказалось нетрудно, потому что у меня свежи основные знания, которые нужны для заданий отборочного тура. И вот я оказался в акселераторе.
Что происходило на стажировке
Акселератор — мой первый опыт стажировки в так называемой «песочнице». Нам с ходу дали серьезные боевые задачи из реальной практики аналитиков, правда не срочные — для таких решений надо было хорошо знать инфраструктуру МегаФона. Я сначала почти ничего не понимал и боялся, но хотел скорее начать карьерный путь.
В акселераторе три месяца стажировались пятеро студентов, с нами занимался ментор Артем Селезнев. Он вел курс молодого бойца: технический ликбез по Hadoop, Spark, SQL, Pipeline и процессам. Он же давал нам домашние задания по Hadoop и Spark.
Еще мы сразу же попали в руки к аналитикам. В первые две недели изучали базу данных и соображали, что можно из них получить. Также мы осваивали весь стек, который используют в big data МегаФона: Oracle Exadata (SQL, PL/SQL), Cloudera Hadoop, Hive, Spark, Pyspark, Python (sklearn, xgboost, pandas, etc), Linux bash. Система контроля версий: git.
Занятия проходили в виде встреч два раза в неделю, каждая встреча занимала два часа.
И тут мне пригодилась вся высшая математика. В работе я строю модели для предсказания, в их основе лежит матанализ, матстатистика, методы оптимизации, линейная алгебра, аналитическая геометрия. Пишу много кода, поэтому нужна база по информатике, знание Python и SQL.
В дополнение к основным задачам каждую неделю мы выбирали капитана нашей скромной команды, который делал доклад по теме, не связанной с построением моделей, — например, RFM-анализ, AB-тесты и их применение.
Атмосфера была ламповая. Занимались в небольшой переговорке в головном офисе на Оружейном переулке. Ребята-аналитики часто к нам заглядывали, помогали с решениями и рассказывали про свои команды.
Мы работали по kanban-системе. Самостоятельно решали задачи, клеили их на kanban-доску, а вопросы — в зону паркинга. Наши руководители или куратор отвечали на них, когда заходили в аудиторию. Руководители — тимлиды направления аналитики больших данных — общались с нами на равных и давали задачи, которые по силам только профессионалам.
Именно на стажировке я сделал три проекта, связанных с машинным обучением, которые помогли мне пройти собеседование.
Первый проект — сегментирование абонентской базы для предложения платных продуктов МегаФона по возрастной группе
Необходимо было построить таргет — целевое событие, которое мы собираемся предсказывать. Сначала я не знал, как приступить к этой задаче. В моем распоряжении была обезличенная база клиентов с описывающими их признаками. На их основе я обучил модель и выявил паттерн поведения клиента, для которого предложение будет наиболее актуальным. Это активный пользователь МегаФона: звонки, интернет, сервисы (например, «МегаФон ТВ», «МегаФон Специи»).
Второй проект — кешбэк в сервисе «МегаФон Путешествия»
Здесь я познакомился с пайплайном построения решения задач в МегаФоне и механизмом автоматизации.
Задача состояла в построении новой модели для определения потенциальных пользователей сервиса «МегаФон Путешествия». Формализована как задача классификации: 1 – пользователь зарегистрируется в сервисе, 0 – не зарегистрируется в течение определенного периода, например, недели. Благодаря некоторой количественной оценке и когортному анализу выбрали подход look-alike, обучили алгоритм классификации и получили довольно неплохие по метрике ROC-AUC и Lift результаты. Модель отправили на тестирование.
Третий проект — «Тряси смартфон», инбаунд
Пользователи МегаФона в личном кабинете раз в неделю трясут смартфоны, и им выпадает индивидуальное предложение: скидка на тарифный план, различные предложения у партнеров, вознаграждение за пополнение баланса на определенную сумму — это могут быть бонусные рубли на счет мобильного телефона, дополнительный пакет минут или гигабайтов интернета. Моей задачей было изучение и изменение индивидуальных предложений. Я реализовал механику подбора, основываясь на различных статистиках, например, уровне интереса. Написал код, который впоследствии был внедрен в работу сервиса. Я и раньше был знаком с этой функцией МегаФона, но редко ей пользовался. Интересно было узнать, как все работает изнутри.
Я справился со всеми задачами и прошел собеседование с Виталием Щербаковым, директором по аналитике больших данных. Теперь буду работать в МегаФоне, чему очень рад.
Придется совмещать дела с учебой, но в этом семестре мы в основном занимаемся дипломом. Все равно предстоит напрячься. Я хочу перенести полезные привычки с работы в повседневную жизнь: в МегаФоне мы ведем задачи в Jira, в телефоне давно установлены органайзеры. Мне нравится техника Pomodoro: работаю 25 минут, потом короткий перерыв на 3–5 минут, а после каждой четвертой 25-минтуки отдых 15–20 минут. Это позволяет самому определять адекватные сроки выполнения задач.
На стажировке я понял, что в работе аналитика хоть и мало космического, зато много творческого. А еще сегодня нельзя аналитиков разделять на две категории — один думает, другой программирует. Каждому аналитику нужно уметь кодить, пусть только для автоматизации процессов и написания скриптов.
Набор в акселератор продолжается. Чтобы узнать подробнее, смотрите вакансию на карьерном сайте МегаФона и пишите рекрутеру Светлане Стакановой на почту [email protected]
Мегафон молодцы что постарались, но текст, который якобы от стажера, но с насыщением странными фразами и заманухами- вызывает странные ощущения. Условия стажировки можно и от лица компании в конце подытожить - было бы более органично, а не как якобы комментарии от первого лица вставлять.
Какой Оружейный проспект? Переулок!
копирайтер который это писал наверное и москвы не видел :)
☝️☝️☝️👍
Ага, выявление пенсионеров и тихое подключение их на платные подписки.
Можно подумать, Мегафон не в курсе возраста своих абонентов
Проект "охота на пенса"🤣🤣🤣
Мне кажется или делать ракеты куда интереснее чем мл?
Ground control to Megafon...
You're off your course
Direction's wrong
Can you hear me, Megafon?
Houst... Errr, Megafon, we've got a problem here!
Этой теме аналитики и больших данных в МегаФоне как минимум лет 10))
Постоянная суета, а результата никакого нет, но не беда: главное же процесс))
Главное распил бюджетов.
Комментарий удален модератором
Мне кажется у мегафона (и у других) обратно работает машин-ленинг
То есть я не пользуюсь мобильной связью почти, почти не ем интернет-трафик, значит мне предложат тариф где будет прорва интернета, прорва минут...
Логика!
Ну так-то логично, вы же меньше сеть нагружаете в таком случае, но платите за потенциальную возможность. Оператор стремится больше денег заработать любыми методами.
Ага, все так.
А почему стажировка называется акселератором ? Обычно этим словом называют фонды, которые занимаются отбором и инвестициями в стартапы
А это бред того пиарщика мегафона,который на коленке строчил эту чушь. Не обращайте внимания.
Комментарий недоступен
Ахахахахаха🤣🤣🤣🤣🤣👍👍👍
Комментарий удален модератором