Как я попала в ряды рок-звёзд российского дип лёрнинга

История бывшего стажёра «ВКонтакте»

Даша Дятлова
Младший программист-разработчик в Команде прикладных исследований

Привет! Меня зовут Даша Дятлова. Ещё два года назад я была рекрутером, а сейчас занимаюсь исследованиями в области эмоционального синтеза речи. Летом я прошла стажировку в команде прикладных исследований ВКонтакте и в итоге попала в штат: уже неделю я младший разработчик.

Как перейти из HR в Data Science, простажироваться в трёх городах и преодолеть все страхи — рассказываю свою историю.

Этой фотографией ребята из команды поздравляли меня с началом стажировки

Вы должны забыть то, что узнали

Часто встречаешь истории в духе «писал код с детского сада, в итоге стал успешным разработчиком». Моя ситуация была совсем другой. Я ощутила интерес к математике и анализу данных только на последнем курсе бакалавриата, когда училась на «управлении персоналом» в Сибирском федеральном университете. И почему профессию нужно выбирать в 17 лет?

И вот я работаю рекрутером, но хочу заниматься Data Science. Что делать? Сначала я пыталась не спешить: мониторила рынок, искала вакансии на стыке областей. Но с моими навыками получался сплошной HR. Тогда я оставила попытки, бросила работу и пошла получать недостающие знания в магистратуру. В этом году окончила питерскую «Вышку» по специальности «машинное обучение и анализ данных».

Во время учёбы у меня сложилось представление о том, чем именно можно заниматься в машинном обучении. Меня привлекло глубокое обучение (DL) и работа с речью.

Совет №1. Не бросайте учёбу

Стажировка не заменит обучение в вузе — по крайней мере в моей профессии. ML в речи — микс математики, цифровой обработки сигнала и программирования, всё это не самые интуитивно понятные вещи. Нужно знать теорию и иметь опыт решения практических задач, чтобы говорить на одном языке с ментором и командой.

А ещё высшее образование даёт представление об области. С ним легче определить карьерные ориентиры и понять, где найти дополнительные знания.

Я обратила внимание, как мало вакансий открывается в интересном для меня направлении. Не слишком много команд в России (да и в мире) работают с голосовыми технологиями. Из-за этого существующие решения не идеальны, что открывает большие возможности для меня как исследователя.

Опыт в HR показал мне, насколько сильно первые шаги влияют на дальнейшее развитие карьеры. Хотелось, чтобы попадание в команду было наиболее точным. Я слышала про некоторых ребят из команды прикладных исследований ВКонтакте и видела, как хорошо складывался их профессиональный путь: это действительно крутые специалисты в глубоком обучении.

Не пробуй. Делай. Или не делай

Я одна из немногих, кому удалось попасть на стажировку ВКонтакте дважды. Прошлым летом пришла в команду Core ML, где занималась рекомендациями. Тогда мне не пришло в голову взглянуть на вакансию стажёра в команде прикладных исследований. Я решила, что это не ML :)

При этом поработать с синтезом речи хотелось ещё год назад. У меня вообще вызывают вау-эффект продукты на основе этой технологии. Из-за особенностей моделей для работы с речью приходится одновременно изучать архитектуры в области картинок, текста и звука — это очень интересно.

Голос — это что-то личное, неотъемлемая часть общения и выражения себя в этом мире. То, что вызывает много эмоций. И то, что ты можешь стать человеком, участвующим в создании технологии, вызывающей у людей положительные эмоции — потрясающе.

По итогам прошлогодней стажировки я не осталась ВКонтакте. Но осталась благодарна команде: мне дали подробный фидбэк, посоветовали доучиться в магистратуре и подтянуть знания. А ещё я познакомилась с ребятами из прикладных исследований. Ваня Самсонов, продакт команды прикладных исследований, показал моё резюме Наде Зуевой, на тот момент она была техлидом по голосовым технологиям. И она согласилась стать ментором для моего диплома. Так я начала свои первые шаги в работе с речевыми технологиями. Спасибо тебе, Надя :)

Как только ВКонтакте объявила о новом наборе на стажировки, я первым делом пошла смотреть, какие задачи приготовила команда прикладных исследований. И — вау! — там был синтез речи!

Мои рабочие будни

Совет №2. Мыслите стратегически

Стажировка неплохо оплачивалась, но я не думала о зарплате и грейдах, когда принимала оффер. Для меня были важнее интересные задачи и команда. В перспективе такой подход поможет не просто достаточно зарабатывать, а ещё и гордиться результатами труда.

Это не универсальный совет — конечно же, ситуации бывают разными. Мне очень повезло с родителями: они поддержали меня на пути смены профессии.

Всегда много путей достичь цель есть

Чтобы попасть на стажировку, предстояло пройти несколько испытаний.

  1. Сначала был онлайн-тест. Нужно было ответить на пять открытых вопросов по машинному обучению.

  2. Потом меня ждало тестовое задание. Нужно было выбрать одну из предложенных менторами статей по машинному обучению в речи и реализовать модель: я остановилась на Fre-GAN. Также меня попросили рассказать о любой интересной мне научной статье. Я серьёзно подошла к тестовому: не только написала корректный и красивый код, но и настроила окружение, удобное логирование графиков и семплов обучения, составила подробный отчёт об экспериментах.
  3. После этого я прошла собеседование с менторами. Обсудили статью, результаты которой я воспроизводила в тестовом, поговорили о том, как работает мой код и как бы я справлялась с разными сценариями. До этого я самостоятельно изучала синтез речи и потому была рада пообщаться на эту тему с экспертами.
с какими мыслями я начала выполнять тестовое
с какими мыслями я отправляла тестовое

Только сейчас, будучи в команде, я наконец испытываю спокойствие, но до него было много сомнений и неуверенности в себе. Всё-таки у меня не профильное первое образование, и я не попала в команду после стажировки в прошлом году. Пару недель я решалась отправить заявку, почти на 5 месяцев растянулся отбор, и с каждым новым этапом росла моя тревога. К концу отбора я просто была одержима целью пройти, в ночь перед собеседованием практически не спала, меня трясло, я читала кучу статей — на самом деле какое-то нелепое упорство, никому не советую так переживать из-за чего-либо, я точно больше не буду :)

Это только начало

И вот я оказалась на стажировке, где начала заниматься синтезом речи. Что это такое? Если вкратце, то мы подаём на вход нейросети текст, чтобы на выходе услышать, как он произносится. Самые известные примеры — голосовые помощники, например Маруся.

Я работала над тем, чтобы модель не просто произносила текст голосом робота, а делала это с радостью, грустью или удивлением.

В поисках работы я встречала много тестовых заданий на позиции джунов и даже мидлов. Все они были не такими интересными и амбициозными, как эмоции в синтезе речи.

Совет №3. Планируйте свои задачи

В работе, как и в жизни, иногда кажется, что цель недосягаема. Но большая дистанция состоит из маленьких шагов. Поэтому нужен чёткий план.

Иногда мои эксперименты оказывались неудачными. Но благодаря планированию я всегда знала, что делать дальше, и это мотивировало. Если неясно, как подступиться к задаче, стоит разбить её на несколько более мелких блоков и попросить о помощи.

Все проблемы во вселенной от того, что никто никому не помогает

Мне помогали два ментора — Виталий Шутов и Андрей Бочарников. С Виталей мы пересекались на общих встречах команды раз в неделю: обсуждали планы, результаты, стратегические вопросы. А с Андреем были ближе к практике: разбирали самые сложные темы, смотрели код. Я очень ценю, что всегда могла обратиться за помощью — даже когда Андрей ушёл в отпуск.

Все мы с ментором на закрытии стажировки

Совет №4. Больше общайтесь с ментором и командой

Время и внимание ментора — это уникальный ресурс. Пользуйтесь им по максимуму: задавайте много вопросов, обсуждайте результаты. Если что-то непонятно, просите пояснить — не стоит стесняться. Это поможет найти новые смыслы.

Ещё можно интересоваться, чем занимаются ребята из команды, откуда появляются новые задачи. И какой путь проходят продукты, прежде чем становятся доступны пользователям.

Что касается общих созвонов, то мы не только рассказывали о своих результатах, но и охотно участвовали в обсуждении задач друг друга, предлагая новое. Генерация идей в команде не прекращается никогда. И неважно, что это за идеи: новый прототип продукта или вариант совместного досуга.

Совет №5. Проявляйте инициативу

Идеи стажёров нуждаются в валидации. Но это не значит, что предлагать их бессмысленно. Делитесь мыслями с командой и будьте открыты: часто гениальное рождается в ходе командного брейншторма.

По вторникам наша команда приходит на работу в пиджаках

Так получилось, что моя стажировка проходила в трёх городах: Питере, Сочи и Москве. Везде мы проводили много времени с командой. В Питере ездили на шашлыки, катались на яхтах и картах, смотрели стэнфордские лекции по ML, ходили на AI-митап, готовили доклады внутри команды о деталях продуктовых запусков. А в Сочи катались на машинах по ночному городу, гуляли по скалам, поднимались в горы. И конечно, работали — ведь это был воркейшн: work + vacation.

Совет №6. Заводите друзей и не забывайте смеяться

Мы проводим значимую часть жизни на работе. И когда коллеги становятся твоими друзьями, жить становится проще и веселее. Расслабьтесь: у стажёра много забот и переживаний, но всё самое страшное — в голове. Наполняйте свои дни положительными эмоциями.

Вы найдёте только то, что вы принесёте

Я шла на стажировку с мыслями, что у меня самый интересный проект во вселенной. А ещё с огромным желанием познакомиться с командой: я давно видела паблик с зарисовками из жизни команды и знала, что ребята там очень весёлые.

Одновременно с этим было много страхов. Переживала, что не справлюсь. Думала, что менторы не смогут уделять достаточно времени на ревью моего кода. Пришлось даже проговорить все опасения с психологом — только тогда я смогла расслабиться.

Совет №7. Сохраняйте результаты работы

В исследованиях крайне важно сохранять всё, что вы делаете: код, результаты экспериментов, свои мысли и наблюдения. Код наверняка ещё придётся использовать позже. А результаты и наблюдения потребуются, чтобы сравнивать эксперименты и делать корректные выводы.

Стажировка превзошла все ожидания. Я не думала, что встречу так много поддержки от менторов и ребят в команде. В середине стажировки мы поняли, как сделать базовый синтез речи с эмоциями, и начали улучшать его качество. Это меня сильно вдохновило.

Совет №8. Прислушивайтесь к себе

Не все дни бывают одинаково продуктивными. Если не получается собраться с мыслями, это может быть признаком усталости. Поэтому я старалась слушать себя: могла уйти пораньше в пятницу и проспать 16 часов, а потом прийти в офис в воскресенье со свежей головой и спокойно доделать задачу.

Еще немного нас с закрытия стажировки

Теперь будь храбр и не оглядывайся назад

По итогам стажировки мне сделали оффер, и теперь я младший разработчик в команде прикладных исследований ВКонтакте. Сейчас я продолжаю исследовать эмоциональный синтез речи как штатный специалист. Обязательно потом поделюсь результатами в статье или на какой-нибудь важной конференции для ML-исследователей :) А может быть, мои наработки даже лягут в основу спецпроекта ВКонтакте — но не буду раскрывать всех секретов.

На стажировке я получила очень ценный опыт: меня ждал новый мир исследований, лучшие задачи, самые неравнодушные люди и, конечно, команда моей мечты.

Так что вот главный совет — действуйте! И тогда всё обязательно сложится.

0
42 комментария
Написать комментарий...
AIAIAI

Кто-нибудь прочитал от начала и до конца?

Ответить
Развернуть ветку
Keyser Soze

Этого не хватает)

Ответить
Развернуть ветку
kuskus kuskus

Пролистал, и подробно рассмотрел фото из похода🤣

Ответить
Развернуть ветку
Roman

Есть видео?

Ответить
Развернуть ветку
Rabbit Rabbin

Друг просит?

Ответить
Развернуть ветку
Pavel SS

нет

Ответить
Развернуть ветку
Георгий Чеботарёв

Ага

Ответить
Развернуть ветку
Панда Ву

Авторша безусловно молодец! Так держать! Но заголовок громковат. «Эгегей, мы тут рок-звезды, со стажерских пеленок!» Скажем так, когда увижу труды ВК в опенсорс, тогда и поговорим кто вы, рок-звезды или прикладники, делающие достаточно сложную, но тривиальную работу, адаптируя решения из недружественных стран.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Quiz

Авторесса

Ответить
Развернуть ветку
Analtoy Wasserschlang

Авториня.

Ответить
Развернуть ветку
ЯжПрограммист

Авториха

Ответить
Развернуть ветку
расслабленный пост-хипстер

Сам себя не похвалишь...

Ответить
Развернуть ветку
Mercator

А вы кто?

Ответить
Развернуть ветку
Александр Бердышев

В этом посте прекрассно всё: и студентка, не изучившая классическое ML и пошедшая сразу в deep learning, выбравшая узкую область - так что теперь работать или в вк, или в ЦРТ, или в гугл пытаться устроиться
и ВК, возомнившие себя FAANG и фигачущие собесы по несколько месяцев.
У меня вызывают острую негативную реакцию компании, устраивающие больше 3х этапов собеседования (hr, тимлид, приёмка на работу).

Ответить
Развернуть ветку
Mercator

Где вы прочитали, что она не изучила классическое МЛ? Автор написал, что закончила вышку и поняла, какая именно тема ее привлекает.

Ответить
Развернуть ветку
your mummy goose

Александру просто все равно было, он хэштеги уловил, а дальше решил, что все как бы понятно и так. Тут, видимо, как с собесами: посты длиной больше, чем в 3 слова, вызывают острую негативную реакцию

Ответить
Развернуть ветку
Александр Бердышев

"Функция потерь - это функция, к оптимизации которой обычно сводится любая задача машинного обучения, мы обычно хотим минимизировать или МАКСИМИЗИРОВАТЬ значение какой-то функции, и вот этой функцией мы называем функцию потерь"
https://youtu.be/DCplj0dE7Wk?t=693
Ну как бы 11 месяцев назад человек что-то выучил кусками про машинное обучение, но глобально ещё не понимал, чем он занимается и что читает с листка на камеру.
А самое угарное, что это в канале "Команда ВКонтакте" - сразу видно уровень "рок звёзд" - или поленились чекнуть запись на официальном канале, или же кто проверял - примерно такого же уровня понимания, о чём речь...
Лол)
5 месяцев собеседуют кандидатов, а потом берут человека по знакомству)

"А ещё я познакомилась с ребятами из прикладных исследований. Ваня Самсонов, продакт команды прикладных исследований, показал моё резюме Наде Зуевой, на тот момент она была техлидом по голосовым технологиям. И она согласилась стать ментором для моего диплома"

Ответить
Развернуть ветку
Mercator

Я думаю, это просто неточная формулировка из-за краткости объяснения. Насколько я понимаю, некоторые задачи могут быть сформулированы как максимизация функции минус эф от икс, где эф от икс - функция потерь.

Ответить
Развернуть ветку
Александр Бердышев

Нет задач в машинном обучении, где нужно максимизировать функцию потерь.
Помимо этого в докладе есть ещё один сильный ляп, не оговорка, а прям системный который даёт понять, что и стажёр, и ментор не понимают, какие инструменты каким образом используют.
Такие вот "рок звёзды".

Ответить
Развернуть ветку
Mercator

Вы невнимательно меня прочитали.

Ответить
Развернуть ветку
Alexander Nikolin

В RL таких задач полно, я вообще не понимаю о чем тут разговор

Ответить
Развернуть ветку
Alexander Nikolin

если же это просто про формальное название "потерь", то хз, это даже смешно :D

Ответить
Развернуть ветку
Александр Бердышев

С регистрацией вас!

Ответить
Развернуть ветку
Alexander Nikolin

терпеть не могу душнил, так что чувство социальной справедливости заставило

Ответить
Развернуть ветку
your mummy goose

я так понимаю, что у тебя нет способности воспринимать профессионализмы и поэтому строго следуешь формально заученным определениям… в целом, пока до сих пор звучит душно, такие вот критики рок-звезд

Ответить
Развернуть ветку
Александр Бердышев

Ну так вы если чушь несёте в докладе, какие тут профессионализмы?!!

Ответить
Развернуть ветку
your mummy goose

а что не чушью было бы?

Ответить
Развернуть ветку
your mummy goose

копетс ты душный, хз че еще на это ответить

Ответить
Развернуть ветку
enter.estate

Я продолжаю исследовать эмоциональный синтез речи в одном из заводских районов своего города, а чего добился ты?

Ответить
Развернуть ветку
CasualCode

Рок звёзды это кто там?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Педро Гонсалес

Без Блэкмора Дип Лёрнинг уже не тот...

Ответить
Развернуть ветку
Георгий Чеботарёв

По мне так отличная статья - мир дружба жвачка! Автор молодец - работай, трудись, расти. Всяких кислотных троллей побоку!

Ответить
Развернуть ветку
Светлана

Автор искренне поделилась своим опытом достижения цели и выразила свою признательность тем, кто ей помог в этом. И это классно!

Ответить
Развернуть ветку
расслабленный пост-хипстер

Рок-звезды – это те, кого все знают. А это кто?

Ответить
Развернуть ветку
Analtoy Wasserschlang

На фото какие-то бездельники.

Ответить
Развернуть ветку
Pavel Gor

Upvote только за Егора

Ответить
Развернуть ветку
reworld

В чем сложность синтезировть речь? С распознаваним да.

Ответить
Развернуть ветку
your mummy goose

хм… в синтезации? А что сложного в распознавании?

Ответить
Развернуть ветку
Андреев Андрей

Спасибо за толковые советы.

Ответить
Развернуть ветку
Элдуза

Молодцы

Ответить
Развернуть ветку
39 комментариев
Раскрывать всегда