Как мечты о космосе привели в МегаФон

Никита Козырев, недавний стажер акселератора big data МегаФона, рассказывает, как устроиться работать в крупную компанию, будучи студентом, что общего у машинного обучения и аэродинамики и куда приводят детские мечты.

За что меня взяли в МегаФон

Меня зовут Никита. Учусь на четвертом курсе Бауманки, а с шестого апреля тружусь в МегаФоне аналитиком и занимаюсь большими данными. Я получил эту работу, потому что целенаправленно к ней шел: учился, искал возможности и, главное, стажировался.

После окончания третьего курса я задумался о своей карьере и понял, что мне необходим опыт. Активно искал работу-стажировку, рассылал резюме по компаниям, принимал участие в отборах.

Я проходил курсы от МФТИ, когда один из студентов — Роман Васильев — рассказал мне о наборе на стажировку в МегаФон. Я решил написать рекрутеру Светлане Стакановой, прошел отбор и поступил в акселератор.

Как я дошел до машинного обучения

Как и многие дети, я мечтал строить ракеты и полететь в космос. Но, к сожалению, однажды понял, что космонавтом не стану: здоровье не то. Поступил в Бауманку и учился в космической сфере, проходил практику на военно-промышленном предприятии. Благодаря Бауманке я осознал, чем хочу заниматься на самом деле. Оказалось, что мне больше нравятся задачи, приближенные к реальной жизни, а не мечты об освоении далеких звезд.

В университете я учусь решать прикладные задачи в области вычислительной математики, механики и математической физики: проводить аэродинамические расчеты, моделировать новые материалы, композиционные материалы и наноструктуры, пишу диплом по теме «Восстановление параметров обтекания в возмущенной области и геометрии ударной волны около затупленного тела».

Я в акселераторе — мне повезло​

В работе я занимаюсь машинным обучением, и, хотя моя вузовская специальность кажется далекой от этой сферы, сходство все-таки есть, особенно в том, что касается математики.

Только не надо думать, что я отказался от детской мечты о ракетах. Просто моя работа — это реализация планов повзрослевшего человека.

Как я попал на стажировку

Когда я искал, где бы прокачать рабочие навыки, целенаправленно шел именно в машинное обучение. Формально с ML познакомился в институте: у нас был курс статистики и методов оптимизации, там я узнал, что можно делать при помощи машинного обучения, и понял, что мне это интересно.

Дальше был период самостоятельного освоения материала: читал статьи на «Хабре», брал курсы на Coursera (один из них по Python — основному языку для ML), реализовывал с нуля библиотеки, писал сайты.

Рабочий момент в акселераторе​

Подготовка и поиск помогли наткнуться на акселератор МегаФона. Меня привлекли условия. На старте обещали обучение, возможное трудоустройство по итогам стажировки и зарплату. Это было круто, потому что любой труд должен быть оплачен, даже если ты еще студент и только проходишь «боевую подготовку».

А дальше я прошел два собеседования. Первое — теоретическое, тест по машинному обучению. Второе — практика: мне выдали метрики и набор обезличенных данных, необходимо было решить бизнес-задачу по классификации за три часа. Оказалось нетрудно, потому что у меня свежи основные знания, которые нужны для заданий отборочного тура. И вот я оказался в акселераторе.

Что происходило на стажировке

Акселератор — мой первый опыт стажировки в так называемой «песочнице». Нам с ходу дали серьезные боевые задачи из реальной практики аналитиков, правда не срочные — для таких решений надо было хорошо знать инфраструктуру МегаФона. Я сначала почти ничего не понимал и боялся, но хотел скорее начать карьерный путь.

В акселераторе три месяца стажировались пятеро студентов, с нами занимался ментор Артем Селезнев. Он вел курс молодого бойца: технический ликбез по Hadoop, Spark, SQL, Pipeline и процессам. Он же давал нам домашние задания по Hadoop и Spark.

Артем Селезнев​

Еще мы сразу же попали в руки к аналитикам. В первые две недели изучали базу данных и соображали, что можно из них получить. Также мы осваивали весь стек, который используют в big data МегаФона: Oracle Exadata (SQL, PL/SQL), Cloudera Hadoop, Hive, Spark, Pyspark, Python (sklearn, xgboost, pandas, etc), Linux bash. Система контроля версий: git.

Занятия проходили в виде встреч два раза в неделю, каждая встреча занимала два часа.

И тут мне пригодилась вся высшая математика. В работе я строю модели для предсказания, в их основе лежит матанализ, матстатистика, методы оптимизации, линейная алгебра, аналитическая геометрия. Пишу много кода, поэтому нужна база по информатике, знание Python и SQL.

В дополнение к основным задачам каждую неделю мы выбирали капитана нашей скромной команды, который делал доклад по теме, не связанной с построением моделей, — например, RFM-анализ, AB-тесты и их применение.

«Униформа» акселератора​

Атмосфера была ламповая. Занимались в небольшой переговорке в головном офисе на Оружейном переулке. Ребята-аналитики часто к нам заглядывали, помогали с решениями и рассказывали про свои команды.

Мы работали по kanban-системе. Самостоятельно решали задачи, клеили их на kanban-доску, а вопросы — в зону паркинга. Наши руководители или куратор отвечали на них, когда заходили в аудиторию. Руководители — тимлиды направления аналитики больших данных — общались с нами на равных и давали задачи, которые по силам только профессионалам.

Наша ​kanban-доска

Именно на стажировке я сделал три проекта, связанных с машинным обучением, которые помогли мне пройти собеседование.

Первый проект — сегментирование абонентской базы для предложения платных продуктов МегаФона по возрастной группе

Необходимо было построить таргет — целевое событие, которое мы собираемся предсказывать. Сначала я не знал, как приступить к этой задаче. В моем распоряжении была обезличенная база клиентов с описывающими их признаками. На их основе я обучил модель и выявил паттерн поведения клиента, для которого предложение будет наиболее актуальным. Это активный пользователь МегаФона: звонки, интернет, сервисы (например, «МегаФон ТВ», «МегаФон Специи»).

Второй проект — кешбэк в сервисе «МегаФон Путешествия»

Здесь я познакомился с пайплайном построения решения задач в МегаФоне и механизмом автоматизации.

Задача состояла в построении новой модели для определения потенциальных пользователей сервиса «МегаФон Путешествия». Формализована как задача классификации: 1 – пользователь зарегистрируется в сервисе, 0 – не зарегистрируется в течение определенного периода, например, недели. Благодаря некоторой количественной оценке и когортному анализу выбрали подход look-alike, обучили алгоритм классификации и получили довольно неплохие по метрике ROC-AUC и Lift результаты. Модель отправили на тестирование.

Третий проект — «Тряси смартфон», инбаунд

Пользователи МегаФона в личном кабинете раз в неделю трясут смартфоны, и им выпадает индивидуальное предложение: скидка на тарифный план, различные предложения у партнеров, вознаграждение за пополнение баланса на определенную сумму — это могут быть бонусные рубли на счет мобильного телефона, дополнительный пакет минут или гигабайтов интернета. Моей задачей было изучение и изменение индивидуальных предложений. Я реализовал механику подбора, основываясь на различных статистиках, например, уровне интереса. Написал код, который впоследствии был внедрен в работу сервиса. Я и раньше был знаком с этой функцией МегаФона, но редко ей пользовался. Интересно было узнать, как все работает изнутри.

Я справился со всеми задачами и прошел собеседование с Виталием Щербаковым, директором по аналитике больших данных. Теперь буду работать в МегаФоне, чему очень рад.

Виталий Щербаков​

Придется совмещать дела с учебой, но в этом семестре мы в основном занимаемся дипломом. Все равно предстоит напрячься. Я хочу перенести полезные привычки с работы в повседневную жизнь: в МегаФоне мы ведем задачи в Jira, в телефоне давно установлены органайзеры. Мне нравится техника Pomodoro: работаю 25 минут, потом короткий перерыв на 3–5 минут, а после каждой четвертой 25-минтуки отдых 15–20 минут. Это позволяет самому определять адекватные сроки выполнения задач.

Все в сборе​

На стажировке я понял, что в работе аналитика хоть и мало космического, зато много творческого. А еще сегодня нельзя аналитиков разделять на две категории — один думает, другой программирует. Каждому аналитику нужно уметь кодить, пусть только для автоматизации процессов и написания скриптов.

Набор в акселератор продолжается. Чтобы узнать подробнее, смотрите вакансию на карьерном сайте МегаФона и пишите рекрутеру Светлане Стакановой на почту [email protected]

0
20 комментариев
Написать комментарий...
Alexey Sorokin

Мегафон молодцы что постарались, но текст, который якобы от стажера, но с насыщением странными фразами и заманухами- вызывает странные ощущения. Условия стажировки можно и от лица компании в конце подытожить - было бы более органично, а не как  якобы комментарии от первого лица вставлять.

Ответить
Развернуть ветку
Vladimir Vorobyev

Какой Оружейный проспект? Переулок!

Ответить
Развернуть ветку
Anton Vlasov

копирайтер который это писал наверное и москвы не видел :)

Ответить
Развернуть ветку
Иван Иванов

☝️☝️☝️👍

Ответить
Развернуть ветку
Дрюс Уилис
Первый проект — сегментирование абонентской базы для предложения платных продуктов МегаФона по возрастной группе

Ага, выявление пенсионеров и тихое подключение их на платные подписки.

Ответить
Развернуть ветку
Вася Пражкин

Можно подумать, Мегафон не в курсе возраста своих абонентов

Ответить
Развернуть ветку
Иван Иванов

Проект "охота на пенса"🤣🤣🤣

Ответить
Развернуть ветку
Андрей Браиловский

Мне кажется или делать ракеты куда интереснее чем мл?

Ответить
Развернуть ветку
Сергей Дедович

Ground control to Megafon...

Ответить
Развернуть ветку
Pixel Lens

You're off your course

Direction's wrong

Can you hear me, Megafon?

Ответить
Развернуть ветку
Bilguun Billy

Houst... Errr, Megafon, we've got a problem here!

Ответить
Развернуть ветку
Андрей Захаров

Этой теме аналитики и больших данных в МегаФоне как минимум лет 10))
Постоянная суета, а результата никакого нет, но не беда: главное же процесс))

Ответить
Развернуть ветку
Иван Иванов

Главное распил бюджетов.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Valeratal Val

Мне кажется у мегафона (и у других) обратно работает машин-ленинг
То есть я не пользуюсь мобильной связью почти, почти не ем интернет-трафик, значит мне предложат тариф где будет прорва интернета, прорва минут... 
Логика!

Ответить
Развернуть ветку
Джон Крайтон

Ну так-то логично, вы же меньше сеть нагружаете в таком случае, но платите за потенциальную возможность. Оператор стремится больше денег заработать любыми методами.

Ответить
Развернуть ветку
Valeratal Val

Ага, все так.

Ответить
Развернуть ветку
Дудкин Илья

А почему стажировка называется акселератором ? Обычно этим словом называют фонды, которые занимаются отбором и инвестициями в стартапы

Ответить
Развернуть ветку
Иван Иванов

А это бред того пиарщика мегафона,который на коленке строчил эту чушь. Не обращайте внимания.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Иван Иванов

Ахахахахаха🤣🤣🤣🤣🤣👍👍👍

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
17 комментариев
Раскрывать всегда