Как Data Science стала моей работой и вдохновением

На простых примерах расскажу, что такое Data Science и как понять, подходит ли эта сфера вам

Как Data Science стала моей работой и вдохновением

От разработки — к анализу данных

Привет! Меня зовут Рафаэль Сайфутдинов, я студент НИУ ВШЭ и выпускник Яндекс Практикума, а теперь — middle аналитик-разработчик в Яндекс Лавке. В Вышке я учусь на третьем курсе по направлению компьютерных наук. Когда я поступал, я даже не знал, что в IT есть не только разработчики, но и аналитики, дата-сайентисты и множество других профессий. Я оказался на программе, более всего приближенной к разработке — «Программная инженерия».

Через полгода я осознал, что не готов настолько глубоко погружаться в код, как это необходимо разработчикам. Но в целом писать что-то несложное было занятно. Меня же больше привлекали математические расчёты, графики и визуализация выводов. Таким образом я нащупал IT-область, которая меня действительно захватила — Data Science. Мне хотелось попробовать себя в этой сфере, хотелось системного обучения и гайданса. В университете наша программа предусматривала только основы, поэтому я начал искать онлайн-курсы, чтобы получить необходимые навыки для работы в аналитике.

В итоге за погружением в новую специальность я отправился в Практикум, на курс «Специалист по Data Science». Мой факультет в Вышке создавался совместно с Яндексом, и последний постоянно был на слуху. Я доверял бренду Яндекса, мне нравится масштаб их продуктов и их образовательные подходы; в будущем я хотел бы строить в Яндексе карьеру. Поэтому с онлайн-школой определился быстро. Мне как студенту очного отделения также было важно, что я смогу сам строить своё расписание и заниматься тогда, когда это удобно. (Ну как «удобно»… когда выхожу после пар). Так и понеслось.

Как Data Science стала моей работой и вдохновением

Что же такое «дата сайенс»?

Грубо говоря, в IT есть разработчики, а есть аналитики и дата-сайентисты. Интуитивно понятно, что разработчики — разрабатывают. Результат работы разработчика — программный код, или приложение, или программа; в общем, какой-то готовый продукт. А у аналитиков и дата-сайентистов, в отличие от разработчиков, результат работы — не конкретный продукт, а ценные выводы, которые они получают из обнаруженных закономерностей в массивах данных. Работа дата-сайентиста может приносить конкретную пользу бизнесу — понятные выводы, которые помогут увеличить прибыль компании. Специалисты по Data Science как тестируют гипотезы, так и помогают оптимизировать текущие процессы.

Что становится результатом работы аналитика? Здесь всё зависит от задачи. Иногда заказчику нужно понять, как меняется и чувствует себя его продукт. В таком случае аналитики могут предоставить дашборд — такой динамический отчёт, в котором можно посмотреть на графики и таблицы по нужным срезам. Иногда заказчик приходит с конкретным вопросом, например «Почему у нас упал средний чек?». Тогда аналитики презентуют объяснение, которое должно быть подкреплено расчётами или графиком. А иногда дата-саентистов просят разработать ML-модель (модель машинного обучения).

Как Data Science стала моей работой и вдохновением

Сейчас я работаю дата-саентистом в Яндекс Лавке. У меня на практике был случай, когда один из менеджеров предложил сделать подписку на кофе в Лавке, которая будет выгодна пользователям и привлечёт больше клиентов. Он пришёл с задачей к аналитикам, чтобы понять, как может выглядеть такая модель и как она будет функционировать. А мы должны были рассчитать, сколько такая подписка должна стоить, на сколько чашек кофе она рассчитана, будет ли она доступна для всех.

Для выполнения подобного задания аналитику нужно изучить данные о текущих пользователях и их привычках: посмотреть, кто чаще всего покупает кофе, какой именно, когда именно. Предположить, как можно грамотно выстроить модель подписки, чтобы она была выгодна для бизнеса и интересна для клиентов. А результатом станут полезные выводы, которые запустят или не запустят работу над новой подпиской. Если при анализе мы выявим убыточные показатели, такое предложение останется в виде нерабочей гипотезы.

Аналитик данных, ML-разработчик, специалист по data science — это всё разные люди?

В анализе данных существуют разные профессии, и да, формально между ними есть различия — хотя на практике в компаниях оно может быть совсем незначительным. Я бы провёл разграничение между аналитиками, ML-разработчиками и дата-саентистами так. Есть аналитики данных, которые:

— умеют проводить AB-тесты;

— разбираются в бизнес-логике и шарят за ключевые метрики бизнеса;

— умеют копаться в данных руками, чтобы найти ответы на свои вопросы;— умеют наглядно и понятно объяснять результат своей работы заказчику;

— умеют обучать и применять ML-модели по уже готовым алгоритмам обучения.

А также есть ML-разработчики, которые напрямую занимаются машинным обучением, а именно:

— как правило, лучше разбираются в программировании и разработке, так как глубже погружены в написание кода;— разрабатывают те самые алгоритмы машинного обучения;

— и умеют внедрять ML-алгоритмы в продукт.

И вот если мы возьмём «золотую середину» между аналитиком данных и ML-разработчиком, то как раз получим дата-саентиста — человека, который одинаково хорошо умеет и то, и другое.

Дважды студент

Возвращаюсь к своей учёбе! Итак, я продолжал учиться программной инженерии в Вышке — и параллельно пошёл погружаться в data science в Практикум. Как я это выдержал?

Начну с того, что у меня уже была теоретическая база из универа. И в Практикуме, как я и предполагал, мне удалось за несколько месяцев развить уже реальные навыки работы с данными. При этом мне едва ли не с нуля пришлось осваивать Python для анализа данных и библиотеки машинного обучения.

<i>Так выглядит программа курса: с нуля на 8 месяцев</i>
Так выглядит программа курса: с нуля на 8 месяцев

Вначале я проходил курс легко. Но после третьего спринта столкнулся с первыми сложностями. Тогда нам дали объёмную домашку по исследовательскому анализу, где нужно было скрупулезно «посидеть» над данными, покопаться в них по несколько раз, проделать одни и те же действия и получить какие-то выводы. Такая монотонная аналитическая работа требует огромного терпения (и с ней нужно свыкнуться, если хочешь погружаться в эту сферу). Но это научило меня большей внимательности и структурированности. В анализе данных не обойтись без рутины. Просто со временем она выполняется на автомате, и не вызывает такого отторжения, как в первые разы.

Обучение в Практикуме выстроено на том, что сначала ты смотришь теорию, а потом пробуешь что-то написать сам. То есть изучаешь необходимый минимум, углубляешься в дополнительные источники, обращаешься к преподавателям, кураторам или просто в чате к комьюнити своего потока, а затем выполняешь практические задания. Учебник даёт базовые знания, но для лучшего погружения в тему нужно подпитываться знаниями из дополнительных источников, много читать и смотреть внешние ресурсы.

Что касается прикладных задач, за которыми я и шёл на курс — с ними у меня сложился приятный пазл. Теоретическая база из университета совместилась с теорией и её применением в Практикуме. С каждым новым спринтом у меня возникало ощущение, что я начинаю больше работать с данными, лучше понимать, как проверять гипотезы. Я научился быстро и качественно обрабатывать массивы данных, обучать на их основе модели, получать готовые решения.

Как я выдержал две учёбы параллельно? Курс Практикума у меня довольно органично совместился с обучением в университете. Возможно, мне просто действительно нравится Data Science, поэтому, когда я приходил домой после пар, не воспринимал учёбу как дополнительную нагрузку. Я был искренне заинтересован в этой теме, и мой внутренний фокус был и остаётся на ней.

Как Data Science стала моей работой и вдохновением

Разумеется, бывают сложные моменты, когда даже любимое дело начинает тебя раздражать: графики получаются кривые, модель не даёт нужного качества, а дедлайн был уже «вчера». В такие моменты начинаешь злиться, ругать себя и всё вокруг — и это нормально. Удивительно, но за время обучения я понял, что именно это и является самым ярким маркером того, что ты обретаешь новые навыки. Когда тебе сложно — вот тогда ты и движешься вперёд.

Я мог уставать физически (и тогда давал себе отдых и перераспределял нагрузку), но моя уверенность в том, что я выбрал правильную сферу, только крепла. И это здорово бодрило и подгоняло меня вперёд. А подробнее о том, как я преодолевал сложные спринты и справлялся с двойной нагрузкой, я рассказал в подкасте выпускников Практикума «Дело практики».

Обучаясь одновременно в Вышке и в Практикуме, я, конечно, неизбежно их сравнивал. На мой взгляд, Вышка даёт фундаментальные знания, которые пригодятся не только в анализе данных. Там и тяжёлая математика, и углубленное программирование, и весь процесс создания и запуска продукта. Но у Вышки нет задачи выпустить крутого подготовленного специалиста. Оттуда выходят научные исследователи, преподаватели, но практических навыков для работы в сфере выпускникам может не хватать. В Практикуме же главная цель — это как раз выпустить человека, который будет сразу готов приступать к работе. Поэтому тут дают самое необходимые практические навыки. Фундаментальные знания здесь не получить, и это нормально. Это не значит, что обучение в Практикуме поверхностное — просто у высшего образования и у Практикума разные задачи.

Есть и другое важное отличие: в Практикуме за тобой чуть больше «следят», чем в университете. И это круто. В университете, если ты начинаешь пропускать пары и не сдавать контрольные, то тебя никто и не будет искать. В Практикуме же есть кураторы, наставники и ревьюеры, которые будут ежедневно поддерживать твой образовательный процесс до самого выпуска. При этом в Практикуме уютная, ламповая атмосфера и неформальное общение — тоже важное отличие от университета.

<i>Так выглядит мой диплом дата-саентиста</i>
Так выглядит мой диплом дата-саентиста

Из студента — в сотрудники Яндекса

Примерно на середине курса я подался на стажировку в Яндекс Браузер и прошёл отбор. На финальном собесе мне задавали вопросы по моей же исследовательской работе, выполненной на курсе. Так я оказался в команде аналитиков Яндекс Браузера. Через три месяца после стажировки я уже перешёл в штат, но на другое направление — в Яндекс Лавку, также в отдел аналитики. Так что сейчас я учусь на третьем курсе как студент — а уже работаю по специальности, которую сам выбрал и на которую переобучился.

<i>Так выглядел мой переход из Поиска в Лавку</i>
Так выглядел мой переход из Поиска в Лавку

Пока я стажировался в команде Браузера, мне пришлось взять две отсрочки на курсе Практикума, чтобы всё успеть. Зато, когда перешёл в Лавку, в команде я встретился с одним из преподавателей с нашего курса, уже как коллега. Так что да — это однозначно стоило упорной работы и сложных совмещений. Теперь я чувствую, что я на своём месте — и могу планомерно развиваться.

Сейчас моя главная цель — карьерный рост до senior-позиции, после которой у меня появится возможность взять на себя роль руководителя. Работой в Лавке я, безусловно, доволен: меня окружает много крутых и интересных экспертов, у которых я учусь каждый день. А ещё Лавка открыла для меня удивительный мир современного ритейла, с которым я до этого был знаком только благодаря закупкам в «Пятёрочке» — а это, на самом деле, целый мир.

Рост в дата-саенсе, по моим наблюдениям, ничем не ограничен. Я знаю пример, как сотрудник из дата-саентиста дорос до генерального директора компании. Обычно ты набираешься опыта, растёшь до senior-позиции и начинаешь руководить — а там можешь вырасти до руководителя службы, отдела, CDO, и наконец CEO.

Как Data Science стала моей работой и вдохновением

Свобода и эстетика Data Science

Лично мне нравится, что в Data Science я намного ближе к различным бизнес-процессам, чем коллеги из разработки. Конечно, разработчики постоянно решают важные задачи «в глубине» продукта. Но при этом ты можешь не особо понимать, как устроен ваш бизнес и логика принятия решений внутри. Аналитики же влияют в том числе на стратегические решения бизнеса, помогают его развиваться.

Анализ данных — очень практичная, применимая сфера. Можно легко вписать свои навыки в том числе в бытовую повседневность, сделать её удобнее и легче. Например, структурировать свои расходы и сформировать такую модель ведения личных финансов, которая поможет отложить энную сумму к концу года. Так Data Science постепенно открывает новый взгляд на собственную жизнь. Мир обрастает цифрами, сквозь которые проступает логика и порядок.

А ещё мне, честно говоря, просто нравится эстетика Data Science: красивые графики и прогнозы моделей.

Как же понять, что Data Science — это ваше?

По моим наблюдениям, дата-саентисты — это общительные и энергичные люди, которые не боятся выражать свою точку зрения и умеют объективно отстаивать её, прислушиваясь при этом к другим. Их драйвит эстетика всех этих графиков и циферок. Они привыкли всё оценивать с аналитической точки зрения, любят проводить расчёты и перепроверять их, чтобы удостовериться наверняка. Для этой сферы, конечно, важны знания математики — анализ данных подразумевает работу с числами. Но при этом здесь не нужна глубокая алгебра или матанализ. Главное — уметь правильно рассуждать при определённом наборе входных данных и обладать логикой (а этому на самом деле математика и учит).

Из основных навыков, помимо технических, здесь безусловно стоит отметить софт-скиллы. Аналитики постоянно коллаборируют с другими отделами, много общаются с людьми, презентуют и объясняют. Английский, конечно, тоже будет полезно знать (как в целом во всём IT). Но меня, например, на собеседованиях об уровне английского не спрашивали.

Чтобы определить наверняка, вам стоит попробовать поработать с данными. Никто не сможет рассказать, насколько это интересно и классно, пока не попробуешь сам и не втянешься в процесс.

Можно начать с простого кейса: взять любые личные данные (те же финансовые расходы, например), записать их в Excel и по-разному покрутить их, сделать новый полезный вывод из того, что вы видите. Затем можно повторить то же самое с данными о продажах какого-нибудь магазина. Сфокусируйтесь на любой сфере, которая вам интересна: в ней найдётся множество данных, с которыми можно поработать. Если есть ощущение, что Data Science вам близок — переходите к бесплатной вводной части курса и дайте ему тест-драйв.

Что почитать или посмотреть про data science? От сердца отрываю вам список моих любимых ютуб-каналов:

📍https://www.youtube.com/@ODSAIGlobal/videos — тут рекомендую посмотреть самые популярные их видео с конференций;

📍 https://www.youtube.com/@start_ds/videos — это канал моего коллеги из Лавки, где достаточно легко объясняется машинное обучение, а также есть интересные интервью;

📍 https://youtu.be/gekKgnP-fRY?si=IaH5TRKL4GU5340v — это однин из лучших в РФ курсов по машинному обучению из моего университета (ВШЭ ФКН), где один из моих любимых преподавателей понятно и просто объясняет основные принципы ML.

Спасибо, что дочитали статью до конца! Подписывайтесь на мой тг-канал, в котором я пишу про аналитику и бизнес простыми словами. И задавайте вопросы в комментариях — постараюсь на всё ответить!

Как Data Science стала моей работой и вдохновением
4
Начать дискуссию