Что должен уметь Data Scientist? Взгляд от первого лица

Александр Ледовский, руководитель команды Data Science в подразделении «Малый и микробизнес» в Сбербанке, выпускник Школы анализа данных Яндекса

Фото из личного архива 
Фото из личного архива 

Многие считают, что ИТ-специалисты работают только с технологиями, но это уже давно не так. ИТ активно проникает в бизнес, формируя новые кроссфункциональные профессии, всё более востребованные на рынке. Одна из них — Data Scientist. Сегодня я расскажу с позиции специалиста в этой области о том, какие скиллы нужны на моей работе и как вообще можно на неё попасть.

Чем занимается Data Scientist

Начну с того, что сама специальность Data Scientist в разных компаниях понимается и используется по-разному. То есть общее название одно, а роли могут различаться.

Например, такой сотрудник может специализироваться на разработке новых алгоритмов машинного обучения. Для него важнее всего глубокие знания математических методов. Таких специалистов относительно немного. Они работают в научных организациях и корпоративных исследовательских лабораториях.

Многие компании рассматривают Data Scientist’а больше как инженера и продвинутого аналитика. В моей команде, например, Data Scientist решает внушительный перечень задач, включая бизнес-анализ, подготовку данных, поиск инсайтов, проведение A/B тестов, собственно разработку моделей, подготовку отчётов для бизнес-заказчиков и частично выкатку в промышленную среду. Некоторые компании называют это full-stack: это значит, что сотрудник полностью отвечает за свою задачу от первоначальной проработки до получения бизнес-эффекта. Мои рекомендации в первую очередь относятся к этому распространённому варианту.

Бывает ещё, что большую часть времени человек занимается обработкой данных и построением моделей, но при этом не погружается в бизнес-процессы. Задачи ему ставит владелец продукта.

Но в любом случае за последние два года интерес работодателей к специальности Data Scientist резко вырос: профессионалы этого профиля стали на 226% более востребованы (данные «Обзора рынка ИТ-вакансий» Яндекс.Практикума). Поэтому в Data Science охотно берут специалистов с небольшим опытом работы и даже без опыта. Доля вакансий для соискателей с опытом меньше года здесь на четверть больше среднерыночной. С другой стороны, чтобы получить хорошую и интересную позицию, нужно обладать достаточно большим набором навыков.

Кто и зачем приходит в Data Science

Сейчас в Data Science идут самые разные люди. В основном это молодые специалисты, но встречаются примеры смены специальности в достаточно зрелом возрасте. Большую часть людей можно условно разделить на две группы. Я постараюсь дать рекомендации для каждой из них.

Специалисты с техническим образованием

Первая категория — это ребята из профильных вузов, которые очень хорошо подкованы в области математики и, возможно, разработки ПО. Некоторые уже имеют опыт работы программистами или учеными в области математики и физики. Но таким молодым людям зачастую не хватает бизнес-навыков.

Data Scientist должен уметь разобраться в бизнес-процессе, понять проблему заказчика и сформулировать на её основе техническую задачу. Причём важно не только правильно сформулировать задачу, но и определить оптимальный способ её решения.

В этом ребята иногда делают ошибки. Например, они прошли курс по глубинному обучению и хотят применить нейронные сети при каждом удобном случае. А на самом деле подойдёт и более простой метод, который даст более понятный и стабильный результат. И это будет во много раз быстрее и эффективнее. Не усложнять — важное правило, о котором надо помнить.

Поскольку аналитику нужно понимать, как устроен бизнес, специалистам с техническим образованием стоит максимально расширять свой кругозор в этой сфере. Например, слушать выступления руководства, посещать презентации других отделов, смотреть собрания акционеров, а ещё активно ходить на отраслевые конференции.

Это помогает прокачать бизнес-интуицию, чтобы правильно ставить задачи и определять пути их решения.

Вообще, начинающему Data Scientist’у будет полезно поработать в разных местах. Бизнес-кругозор достаточно важен, поскольку Data Scientist — более широкая специальность, чем, скажем, разработчик.

Есть ещё одна закономерность: чем сильнее конкуренция в отрасли, тем важнее развитые soft skills. Да, в Data Science конкуренция сейчас невысока, но ситуация будет меняться, и надо развиваться.

Кроме того, чем выше позиция, на которую ты претендуешь, тем важнее навыки общения с людьми других специальностей в сочетании с прокачкой soft skills. То есть нужно воспитывать в себе дисциплину, учиться тайм-менеджменту, тренировать умение интервьюировать бизнес-экспертов, делать отчёты и презентации, ставить цели и выполнять их в срок.

На умении интервьюировать стоит остановиться подробнее. Почему это так важно? Иногда бизнес-заказчики в полной мере сами не знают, чего хотят, или не могут это сформулировать. Заказчик приходит с той проблемой, которую он видит. И ставит задачу, исходя из своих компетенций и своего видения бизнес-процессов. Поэтому Data Scientist должен задавать правильные вопросы, чтобы понять суть проблемы и определить порядок действий. В консалтинговых компаниях существуют специальные тренинги по этой компетенции.

Не менее важно умение взаимодействовать с руководителем. Хороший специалист должен уменьшать количество проблем у босса, а не увеличивать. Нужно научиться понимать ту грань, после которой у тебя не хватает навыков, опыта или полномочий справиться с задачей собственными силами, и нужно подключить руководителя.

Развивающиеся аналитики

Вторая категория людей, которые идут в Data Science — это те, кто уже поработал в бизнес-аналитике и теперь хочет развиваться в сторону анализа данных. Для них Data Science — это вариант профессионального роста. Собственно, мой путь был именно такой.

Таким специалистам в первую очередь важно подтянуть базовые дисциплины — программирование и математику. Также нужно получить знания в области статистики и современных алгоритмов машинного обучения. Курсов сейчас очень много, в том числе бесплатных. Рекомендую присоединиться к сообществу Open Data Science (https://ods.ai), а также попробовать себя в решении соревнований по построению моделей машинного обучения на Kaggle и других платформах.

Переквалификация до уровня Junior Data Scientist может занять около года. Однако при наличии определённого бэкграунда и при правильной расстановке приоритетов можно пройти этот путь быстрее.

Важно помнить, что для бизнеса главное не построить сложную модель машинного обучения, а получить экономический эффект. Опыт реальных проектов и знание процессов — серьёзное преимущество. Часто относительно несложными методами можно улучшить процессы, которые до этого работали на экспертных решениях.

Немного личного опыта

Я начал работать на позиции Data Scientist более трёх лет назад. До этого я самостоятельно изучал машинное обучение полгода. Но у меня уже были определённый технический бэкграунд, опыт работы аналитиком в компании Big-4 и скиллы в области программирования. За прошедшее время я поработал в биотех-стартапе и в международной IT-компании, а сейчас работаю в Сбербанке, в подразделении «Малый и микробизнес». Сейчас я уже руковожу командой. Нашу команду я позиционирую как внутренний консалтинг. Мы помогаем коллегам, экспертам в своих бизнес-процессах, реализовывать DS решения. Удовлетворение мы получаем, когда решение достигает реального бизнес-результата.

Помимо опыта, на мой карьерный рост повлияло обучение в Школе анализа данных Яндекса, где сейчас, возможно, одна из лучших программ подготовки Data Scientist’ов в России. Там преподают ведущие учёные и опытные сотрудники Яндекса и других компаний. Также очень помогло обучение вместе с сильными сокурсниками, за которыми нужно было тянуться. Поступить туда было достаточно сложно, поэтому я год готовился к вступительным экзаменам с преподавателем. Обучение в ШАДе занимает более 20 часов в неделю, но оно того стоит.

Университетское образование даёт фундаментальные знания, но оно, к сожалению, часто оторвано от практики, особенно в ИТ-сфере. Важно учиться Data Science у тех, кто прямо сейчас работает в этой области, следить за трендами и пробовать свои силы в реальных проектах. Тогда всё получится.

1818
4 комментария

Спасибо! Так мало живых откликов в сети от практикущих специалистов. Можете посоветовать хорошие книжки по специальности?
После окончания шад яндекс они помогали с трудоустройством? С какой базой туда реально поступить?

1

Откройте сайт школы, и посмотрите образцы вступительных экзаменов за предыдущие года. Там же есть список рекомендуемой литературы.

Подскажите как начинающему попасть в DS проект и вилиться в профессию.

1

Для начала залогиньтесь в слак ods.ai, там есть канал jobs, куда постоянно скидывают кучу вакансий. Почти всегда если ищут джунов, то готовы рассмотреть и стажеров.