Что должен уметь Data Scientist? Взгляд от первого лица

Александр Ледовский, руководитель команды Data Science в подразделении «Малый и микробизнес» в Сбербанке, выпускник Школы анализа данных Яндекса

В закладки
Аудио
Фото из личного архива 

Многие считают, что ИТ-специалисты работают только с технологиями, но это уже давно не так. ИТ активно проникает в бизнес, формируя новые кроссфункциональные профессии, всё более востребованные на рынке. Одна из них — Data Scientist. Сегодня я расскажу с позиции специалиста в этой области о том, какие скиллы нужны на моей работе и как вообще можно на неё попасть.

Чем занимается Data Scientist

Начну с того, что сама специальность Data Scientist в разных компаниях понимается и используется по-разному. То есть общее название одно, а роли могут различаться.

Например, такой сотрудник может специализироваться на разработке новых алгоритмов машинного обучения. Для него важнее всего глубокие знания математических методов. Таких специалистов относительно немного. Они работают в научных организациях и корпоративных исследовательских лабораториях.

Многие компании рассматривают Data Scientist’а больше как инженера и продвинутого аналитика. В моей команде, например, Data Scientist решает внушительный перечень задач, включая бизнес-анализ, подготовку данных, поиск инсайтов, проведение A/B тестов, собственно разработку моделей, подготовку отчётов для бизнес-заказчиков и частично выкатку в промышленную среду. Некоторые компании называют это full-stack: это значит, что сотрудник полностью отвечает за свою задачу от первоначальной проработки до получения бизнес-эффекта. Мои рекомендации в первую очередь относятся к этому распространённому варианту.

Бывает ещё, что большую часть времени человек занимается обработкой данных и построением моделей, но при этом не погружается в бизнес-процессы. Задачи ему ставит владелец продукта.

Но в любом случае за последние два года интерес работодателей к специальности Data Scientist резко вырос: профессионалы этого профиля стали на 226% более востребованы (данные «Обзора рынка ИТ-вакансий» Яндекс.Практикума). Поэтому в Data Science охотно берут специалистов с небольшим опытом работы и даже без опыта. Доля вакансий для соискателей с опытом меньше года здесь на четверть больше среднерыночной. С другой стороны, чтобы получить хорошую и интересную позицию, нужно обладать достаточно большим набором навыков.

Кто и зачем приходит в Data Science

Сейчас в Data Science идут самые разные люди. В основном это молодые специалисты, но встречаются примеры смены специальности в достаточно зрелом возрасте. Большую часть людей можно условно разделить на две группы. Я постараюсь дать рекомендации для каждой из них.

Специалисты с техническим образованием

Первая категория — это ребята из профильных вузов, которые очень хорошо подкованы в области математики и, возможно, разработки ПО. Некоторые уже имеют опыт работы программистами или учеными в области математики и физики. Но таким молодым людям зачастую не хватает бизнес-навыков.

Data Scientist должен уметь разобраться в бизнес-процессе, понять проблему заказчика и сформулировать на её основе техническую задачу. Причём важно не только правильно сформулировать задачу, но и определить оптимальный способ её решения.

В этом ребята иногда делают ошибки. Например, они прошли курс по глубинному обучению и хотят применить нейронные сети при каждом удобном случае. А на самом деле подойдёт и более простой метод, который даст более понятный и стабильный результат. И это будет во много раз быстрее и эффективнее. Не усложнять — важное правило, о котором надо помнить.

Поскольку аналитику нужно понимать, как устроен бизнес, специалистам с техническим образованием стоит максимально расширять свой кругозор в этой сфере. Например, слушать выступления руководства, посещать презентации других отделов, смотреть собрания акционеров, а ещё активно ходить на отраслевые конференции.

Это помогает прокачать бизнес-интуицию, чтобы правильно ставить задачи и определять пути их решения.

Вообще, начинающему Data Scientist’у будет полезно поработать в разных местах. Бизнес-кругозор достаточно важен, поскольку Data Scientist — более широкая специальность, чем, скажем, разработчик.

Есть ещё одна закономерность: чем сильнее конкуренция в отрасли, тем важнее развитые soft skills. Да, в Data Science конкуренция сейчас невысока, но ситуация будет меняться, и надо развиваться.

Кроме того, чем выше позиция, на которую ты претендуешь, тем важнее навыки общения с людьми других специальностей в сочетании с прокачкой soft skills. То есть нужно воспитывать в себе дисциплину, учиться тайм-менеджменту, тренировать умение интервьюировать бизнес-экспертов, делать отчёты и презентации, ставить цели и выполнять их в срок.

На умении интервьюировать стоит остановиться подробнее. Почему это так важно? Иногда бизнес-заказчики в полной мере сами не знают, чего хотят, или не могут это сформулировать. Заказчик приходит с той проблемой, которую он видит. И ставит задачу, исходя из своих компетенций и своего видения бизнес-процессов. Поэтому Data Scientist должен задавать правильные вопросы, чтобы понять суть проблемы и определить порядок действий. В консалтинговых компаниях существуют специальные тренинги по этой компетенции.

Не менее важно умение взаимодействовать с руководителем. Хороший специалист должен уменьшать количество проблем у босса, а не увеличивать. Нужно научиться понимать ту грань, после которой у тебя не хватает навыков, опыта или полномочий справиться с задачей собственными силами, и нужно подключить руководителя.

Развивающиеся аналитики

Вторая категория людей, которые идут в Data Science — это те, кто уже поработал в бизнес-аналитике и теперь хочет развиваться в сторону анализа данных. Для них Data Science — это вариант профессионального роста. Собственно, мой путь был именно такой.

Таким специалистам в первую очередь важно подтянуть базовые дисциплины — программирование и математику. Также нужно получить знания в области статистики и современных алгоритмов машинного обучения. Курсов сейчас очень много, в том числе бесплатных. Рекомендую присоединиться к сообществу Open Data Science (https://ods.ai), а также попробовать себя в решении соревнований по построению моделей машинного обучения на Kaggle и других платформах.

Переквалификация до уровня Junior Data Scientist может занять около года. Однако при наличии определённого бэкграунда и при правильной расстановке приоритетов можно пройти этот путь быстрее.

Важно помнить, что для бизнеса главное не построить сложную модель машинного обучения, а получить экономический эффект. Опыт реальных проектов и знание процессов — серьёзное преимущество. Часто относительно несложными методами можно улучшить процессы, которые до этого работали на экспертных решениях.

Немного личного опыта

Я начал работать на позиции Data Scientist более трёх лет назад. До этого я самостоятельно изучал машинное обучение полгода. Но у меня уже были определённый технический бэкграунд, опыт работы аналитиком в компании Big-4 и скиллы в области программирования. За прошедшее время я поработал в биотех-стартапе и в международной IT-компании, а сейчас работаю в Сбербанке, в подразделении «Малый и микробизнес». Сейчас я уже руковожу командой. Нашу команду я позиционирую как внутренний консалтинг. Мы помогаем коллегам, экспертам в своих бизнес-процессах, реализовывать DS решения. Удовлетворение мы получаем, когда решение достигает реального бизнес-результата.

Помимо опыта, на мой карьерный рост повлияло обучение в Школе анализа данных Яндекса, где сейчас, возможно, одна из лучших программ подготовки Data Scientist’ов в России. Там преподают ведущие учёные и опытные сотрудники Яндекса и других компаний. Также очень помогло обучение вместе с сильными сокурсниками, за которыми нужно было тянуться. Поступить туда было достаточно сложно, поэтому я год готовился к вступительным экзаменам с преподавателем. Обучение в ШАДе занимает более 20 часов в неделю, но оно того стоит.

Университетское образование даёт фундаментальные знания, но оно, к сожалению, часто оторвано от практики, особенно в ИТ-сфере. Важно учиться Data Science у тех, кто прямо сейчас работает в этой области, следить за трендами и пробовать свои силы в реальных проектах. Тогда всё получится.

Материал опубликован пользователем.
Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Александр Ледовский", "author_type": "self", "tags": ["\u044f\u043d\u0434\u0435\u043a\u0441","datascientist","datascience"], "comments": 4, "likes": 24, "favorites": 39, "is_advertisement": false, "subsite_label": "hr", "id": 87429, "is_wide": false, "is_ugc": true, "date": "Thu, 10 Oct 2019 15:10:16 +0300", "is_special": false }
0
{ "id": 87429, "author_id": 375335, "diff_limit": 1000, "urls": {"diff":"\/comments\/87429\/get","add":"\/comments\/87429\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/87429"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199121, "last_count_and_date": null }
4 комментария
Популярные
По порядку
1

Спасибо! Так мало живых откликов в сети от практикущих специалистов. Можете посоветовать хорошие книжки по специальности?
После окончания шад яндекс они помогали с трудоустройством? С какой базой туда реально поступить?

Ответить
0

Откройте сайт школы, и посмотрите образцы вступительных экзаменов за предыдущие года. Там же есть список рекомендуемой литературы.

Ответить
1

Подскажите как начинающему попасть в DS проект и вилиться в профессию.

Ответить
0

Для начала залогиньтесь в слак ods.ai, там есть канал jobs, куда постоянно скидывают кучу вакансий. Почти всегда если ищут джунов, то готовы рассмотреть и стажеров.

Ответить
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "Article Branding", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cfovx", "p2": "glug" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Баннер в ленте на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "disable": true, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } }, { "id": 20, "label": "Кнопка в сайдбаре", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cgxmr", "p2": "gnwc" } } } ] { "page_type": "default" }