«Дата-сайенс-сообщество — камерная тусовка, поэтому нетворкинг — наше все». Как в Яндекс.Такси нанимают дата-сайентистов

Мы постоянно рассказываем, как разные компании закрывают конкретные позиции в IT. Например, можете прочитать про наем аналитиков, мобильных разработчиков и девопс-инженеров.

«Дата-сайенс-сообщество — камерная тусовка, поэтому нетворкинг — наше все». Как в Яндекс.Такси нанимают дата-сайентистов

На очереди дата-сайентисты (Data Scientist) — относительно новая профессия, которая находится на пике популярности. Такие специалисты нужны многим компаниям, но на рынке дефицит сильных кандидатов.

Мы поговорили о найме дата-сайентистов с Анастасией Куприяновой из Яндекс Такси. Анастасия рассказала, чем занимаются эти специалисты, где их искать и как устроен отбор на эту позицию.

Анастасия Куприянова
тимлид подбора в направлениях аналитики и ML, Яндекс Такси

Кто такие дата-сайентисты и чем они занимаются

Дата-сайентисты строят модели для обработки данных — например, нейросети, модели машинного обучения и компьютерного зрения. Модели позволяют быстрее обрабатывать большие массивы данных и тестировать гипотезы, автоматизируют принятие решений.

Типичный пример — система банковского скоринга. Раньше решение о выдаче кредита принимал специальный человек — андеррайтер. Но потом дерево решений переложили в модель, которая сама определяет, одобрить заявку или отказать.

В Яндекс. Такси модели отвечают за построение маршрутов и распределение заказов. Например, водитель получает уведомление о заказах, которые находятся близко к нему, а не по всей Москве. А еще с помощью моделей мы сегментируем аудиторию пользователей и находим наилучшие каналы коммуникации.

Дата-сайентист — это молодая профессия, раньше ее не существовало. Люди, которые выполняли схожие задачи, в различных сферах назывались по-разному: аналитики, модельеры, скорингисты, актуарии, кванты. С 2019 года начался бум на data science, и все стали «дата-сайентистами».

Это сильно мешает в поиске: человек, который делает отчеты в экселе, тоже может называть себя дата-сайентистом. Поэтому нельзя просто ориентироваться на название должности в резюме: надо читать про задачи, которые решал кандидат, смотреть, с каким технологическим стеком он работал.

Сложно сказать, какие конкретно задачи должен решать дата-сайентист: работодатели вкладывают разный смысл в эту роль. Например, есть организации с четким функциональным разделением: один специалист занимается предобработкой данных, другой создает модели, третий выводит эти модели в продакшен. А в некоторых компаниях, в том числе в Яндексе, за все эти процессы отвечает один человек.

Поэтому, когда ваш заказчик просит найти дата-сайентиста, важно понять, что именно он вкладывает в это понятие: вариантов может быть много.

Зарплатные ожидания дата-сайентистов

Дата-сайенс — популярное направление, а рынок перегрет крупными игроками, которые готовы платить высокие зарплаты, чтобы заполучить достойного специалиста.

В июне 2022 года зарплатные ожидания кандидатов на рынке примерно такие:

«Дата-сайенс-сообщество — камерная тусовка, поэтому нетворкинг — наше все». Как в Яндекс.Такси нанимают дата-сайентистов

Эти цифры нельзя анализировать в отрыве от мотивационных пакетов. Например, кто-то может компенсировать более низкий оклад опционами и премиями.

Зарплатные ожидания кандидатов сильно зависят от экономических и политических событий. В марте 2022 года, когда падал рубль, люди просили привязать зарплату к курсу доллара. Сейчас же кандидаты ссылаются на уровень вознаграждения в западных компаниях, потому что активно общаются с иностранными работодателями.

Тенденции каждый месяц разные, но крупный бизнес не так быстро реагирует на эти изменения. Поэтому ситуация с зарплатами дата-сайентистов на рынке сейчас примерно такая же, как и в самом начале 2022 года.

Где искать дата-сайентистов

Чаще всего поиск холодный. Если разместить вакансию, то можно собрать много откликов, но большинство из них будут нерелевантными. Мы работаем со всеми возможными источниками кандидатов: LinkedIn, Kaggle, Хедхантером, профессиональными группами и сообществами, вузами и курсами, проводим стажировки. Расскажу о некоторых источниках подробнее.

Сообщество ODS

ODS — сообщество аналитиков и дата-сайентистов в Slack, откуда мы нанимали целые команды. Но есть нюанс: советую публиковать вакансии от лица нанимающего менеджера, а не рекрутера — так к ним будет больше доверия.

Каналы в телеграме

Профессиональных каналов довольно много, но я выделю следующие:

Kaggle

Это социальная сеть для дата-сайентистов, где они соревнуются в решении задач. Если зайти в профиль кандидата на Kaggle, то можно посмотреть все его медали за участие в конкурсах и оценить профессиональный уровень.

Но стоит хорошо подумать, прежде чем гоняться за чемпионами. Многие из них зарабатывают себе на жизнь победами на соревнованиях и не рассматривают возможность трудоустройства. Кроме того, если человек хорошо решает задачи на конкурсах, совсем не обязательно, что он будет столь же эффективен в реальной работе, когда нужно глубоко погрузиться в продукт и специфику бизнеса.

HeadHunter

Хороших кандидатов можно найти везде, в том числе и на Хедхантере. Просто придется потратить больше времени на проверку резюме. Но этот источник вполне подходит, если вам нужен стажер или джун.

Вузы и курсы

МФТИ, МГУ, ВШЭ — классический набор университетов, откуда компании забирают талантливых кандидатов. Многие крупные игроки взаимодействуют с этими вузами: открывают кафедры, ищут амбассадоров в студенческих сообществах.

Однажды на прошлой моей работе мы наняли сразу трех одногруппников за месяц — они пришли друг за другом. Дата-сайентисты вообще часто мигрируют из одной компании в другую не по одному, а группами.

Сейчас появляется все больше курсов по работе с данными — спрос рождает предложение. Выпускников этих курсов можно брать на стажировки или даже сразу в штат на начальные позиции. Например, Яндекс сотрудничает с ШАД — Школой анализа данных.

Стажировки

Мы любим выращивать сотрудников внутри. С помощью стажировок Яндекс находит молодых звездочек и закрывает около 25% вакансий ежегодно. Стажеры выполняют задачи под руководством наставника, общаются с будущим руководителем и попадают в штат, если все складывается удачно.

Соревнования

Хакатоны — это еще один инструмент привлечения внимания к бренду работодателя и вакансиям. Дата-сайентисты обожают соревноваться и ломать голову. Чем интереснее и сложнее задачи, тем больше внимания они привлекают: если хорошо подготовиться к ивенту, то можно собрать толпу потенциальных кандидатов около вашего стенда или стола.

Важно понимать: даже если дата-сайентист тратит время на ваши задачи, это совершенно не говорит о его желании попасть к вам на работу. Многие специалисты посещают соревнования ради удовольствия, а не для трудоустройства.

Внутренняя база кандидатов

У нас общая база кандидатов и практически бесшовный процесс коммуникации рекрутеров внутри всего Яндекса, ведь мы единая структура. Поэтому к нам могут попадать кандидаты из иных направлений бизнеса. И наоборот: допустим, человек не подошел нам в Яндекс Такси, но оказался интересен другим командам.

Этапы найма дата-сайентистов

HR-скрининг

Рекрутер спрашивает кандидата о его задачах, опыте и стеке технологий, а также сам отвечает на вопросы. Отсев идет по следующим критериям:

  • Стек — если кандидат не работает с нашими инструментами, скорее всего, будет отказ.
  • Базовые знания в математике — на скрининге мы даем простые задачи, например на теорию вероятностей.
  • Задачи. Если человек хочет заниматься нейросетями, не стоит его звать, чтобы строить простые логистические регрессии: мэтча не будет. Точно так же бесполезно рассматривать сениора на джуновые задачи.

Техническое интервью

Этот этап состоит из 2 секций — каждая в среднем длится по часу. Первая секция посвящена теории и практике машинного обучения, вторая — написанию кода на Python и C++.

Технические секции проводит не нанимающий менеджер, а специальный интервьюер, который осуществляет независимую оценку. Как правило, на этапе технического интервью не обсуждается конкретная вакансия: распределение и выбор происходит уже позже — на финалах.

Финалы

Финал — это отдельная встреча кандидата с потенциальным руководителем. Они общаются о жизни и бизнес-процессах, обсуждают кейсы, чтобы понять, подходят ли друг другу.

Финалов может быть несколько, если претендент заинтересовал разные команды. В таком случае выбор конкретной команды за кандидатом. Нанимающие менеджеры будут предлагать ему свои вакансии, но финансовые условия остаются одинаковыми при любом выборе — «убеждать деньгами» нельзя.

Софт-скиллы дата-сайентиста

Требования по софтам зависят от позиции и задач, которые будет решать специалист. Например, для джунов критически важна стрессоустойчивость и обучаемость. Если же дата-сайентисту предстоит тесно общаться с бизнесом, то на первый план выходят коммуникабельность и умение доносить свои мысли.

Хард-скиллы дата-сайентиста

В первую очередь кандидату нужна хорошая математическая база — как минимум знание теории вероятностей и математической статистики. Обычно эта база формируется за счет образования.

Если посмотреть на портрет успешного кандидата, то картина будет стандартной: технический вуз и специальность, связанная с математикой, физикой, информатикой или экономикой. Встречаются и самоучки: я слышала историю, как профессиональный скрипач погрузился в математику и анализ данных, хорошо подготовился и успешно прошел техническое интервью на джуновую позицию.

Кроме того, нужны знания языков программирования, библиотек и фреймворков. Причем у Яндекса своя специфика: наши дата-сайентисты не только создают модели, но и выводят их в продакшен, то есть встраивают в код. Поэтому в дополнение к Python кандидату желательно еще и знать C++.

Специфика найма дата-сайентистов

Фокус на задачи

Для кандидатов важны задачи: если они скучные или слишком простые, то найти сильного специалиста будет сложно, даже за хорошие деньги. Поэтому при снятии заявки стоит расспросить нанимающего менеджера:

  • Что конкретно предстоит делать будущему сотруднику.
  • Какие задачи будут рутинными.
  • В каком объеме придется заниматься документацией — дата-сайентисты этого не любят. Дело в том, что любая модель должна быть описана, чтобы работать с ней мог не только ее создатель. Поэтому уточните у нанимающего менеджера, кто будет документировать модели.

Сложный скрининг резюме

Релевантный кандидат может называть себя как угодно — хоть аналитиком, хоть ML-девопсом. Поэтому важно внимательно изучать текст резюме, а не просто пробегать по нему глазами в поисках ключевых слов.

Телеграм-канал Хантфлоу https://t. me/huntflow

Подписывайтесь🔥

Нетворкинг творит чудеса

Многие вакансии я закрываю через знакомых. DS-сообщество — это камерная тусовка, куда важно попасть рекрутеру. Поэтому нетворкинг — наше все.

Наш блог читают более 12 000 рекрутеров и профессионалов HR-индустрии. Подкасты, интервью, тематические статьи и экспертные мнения. Переходите по ссылке:

33
2 комментария

Комментарий недоступен

Ответить

Статья про дата саенс, а пишут про аналитику данных, ой вей...

Сложно сказать, какие конкретно задачи должен решать дата-сайентистПоэтому мы сами особо не разобрались, смешали в кучу и сделали для вас статью. Становитесь дата саенцистами, аналитиками данных, да нам похер кароче, что модно тем и становитесь да!

Ответить