Как я попала в ряды рок-звёзд российского дип лёрнинга
История бывшего стажёра «ВКонтакте»
Привет! Меня зовут Даша Дятлова. Ещё два года назад я была рекрутером, а сейчас занимаюсь исследованиями в области эмоционального синтеза речи. Летом я прошла стажировку в команде прикладных исследований ВКонтакте и в итоге попала в штат: уже неделю я младший разработчик.
Как перейти из HR в Data Science, простажироваться в трёх городах и преодолеть все страхи — рассказываю свою историю.
Вы должны забыть то, что узнали
Часто встречаешь истории в духе «писал код с детского сада, в итоге стал успешным разработчиком». Моя ситуация была совсем другой. Я ощутила интерес к математике и анализу данных только на последнем курсе бакалавриата, когда училась на «управлении персоналом» в Сибирском федеральном университете. И почему профессию нужно выбирать в 17 лет?
И вот я работаю рекрутером, но хочу заниматься Data Science. Что делать? Сначала я пыталась не спешить: мониторила рынок, искала вакансии на стыке областей. Но с моими навыками получался сплошной HR. Тогда я оставила попытки, бросила работу и пошла получать недостающие знания в магистратуру. В этом году окончила питерскую «Вышку» по специальности «машинное обучение и анализ данных».
Во время учёбы у меня сложилось представление о том, чем именно можно заниматься в машинном обучении. Меня привлекло глубокое обучение (DL) и работа с речью.
Я обратила внимание, как мало вакансий открывается в интересном для меня направлении. Не слишком много команд в России (да и в мире) работают с голосовыми технологиями. Из-за этого существующие решения не идеальны, что открывает большие возможности для меня как исследователя.
Опыт в HR показал мне, насколько сильно первые шаги влияют на дальнейшее развитие карьеры. Хотелось, чтобы попадание в команду было наиболее точным. Я слышала про некоторых ребят из команды прикладных исследований ВКонтакте и видела, как хорошо складывался их профессиональный путь: это действительно крутые специалисты в глубоком обучении.
Не пробуй. Делай. Или не делай
Я одна из немногих, кому удалось попасть на стажировку ВКонтакте дважды. Прошлым летом пришла в команду Core ML, где занималась рекомендациями. Тогда мне не пришло в голову взглянуть на вакансию стажёра в команде прикладных исследований. Я решила, что это не ML :)
При этом поработать с синтезом речи хотелось ещё год назад. У меня вообще вызывают вау-эффект продукты на основе этой технологии. Из-за особенностей моделей для работы с речью приходится одновременно изучать архитектуры в области картинок, текста и звука — это очень интересно.
По итогам прошлогодней стажировки я не осталась ВКонтакте. Но осталась благодарна команде: мне дали подробный фидбэк, посоветовали доучиться в магистратуре и подтянуть знания. А ещё я познакомилась с ребятами из прикладных исследований. Ваня Самсонов, продакт команды прикладных исследований, показал моё резюме Наде Зуевой, на тот момент она была техлидом по голосовым технологиям. И она согласилась стать ментором для моего диплома. Так я начала свои первые шаги в работе с речевыми технологиями. Спасибо тебе, Надя :)
Как только ВКонтакте объявила о новом наборе на стажировки, я первым делом пошла смотреть, какие задачи приготовила команда прикладных исследований. И — вау! — там был синтез речи!
Всегда много путей достичь цель есть
Чтобы попасть на стажировку, предстояло пройти несколько испытаний.
Сначала был онлайн-тест. Нужно было ответить на пять открытых вопросов по машинному обучению.
- Потом меня ждало тестовое задание. Нужно было выбрать одну из предложенных менторами статей по машинному обучению в речи и реализовать модель: я остановилась на Fre-GAN. Также меня попросили рассказать о любой интересной мне научной статье. Я серьёзно подошла к тестовому: не только написала корректный и красивый код, но и настроила окружение, удобное логирование графиков и семплов обучения, составила подробный отчёт об экспериментах.
- После этого я прошла собеседование с менторами. Обсудили статью, результаты которой я воспроизводила в тестовом, поговорили о том, как работает мой код и как бы я справлялась с разными сценариями. До этого я самостоятельно изучала синтез речи и потому была рада пообщаться на эту тему с экспертами.
Только сейчас, будучи в команде, я наконец испытываю спокойствие, но до него было много сомнений и неуверенности в себе. Всё-таки у меня не профильное первое образование, и я не попала в команду после стажировки в прошлом году. Пару недель я решалась отправить заявку, почти на 5 месяцев растянулся отбор, и с каждым новым этапом росла моя тревога. К концу отбора я просто была одержима целью пройти, в ночь перед собеседованием практически не спала, меня трясло, я читала кучу статей — на самом деле какое-то нелепое упорство, никому не советую так переживать из-за чего-либо, я точно больше не буду :)
Это только начало
И вот я оказалась на стажировке, где начала заниматься синтезом речи. Что это такое? Если вкратце, то мы подаём на вход нейросети текст, чтобы на выходе услышать, как он произносится. Самые известные примеры — голосовые помощники, например Маруся.
Я работала над тем, чтобы модель не просто произносила текст голосом робота, а делала это с радостью, грустью или удивлением.
В поисках работы я встречала много тестовых заданий на позиции джунов и даже мидлов. Все они были не такими интересными и амбициозными, как эмоции в синтезе речи.
Все проблемы во вселенной от того, что никто никому не помогает
Мне помогали два ментора — Виталий Шутов и Андрей Бочарников. С Виталей мы пересекались на общих встречах команды раз в неделю: обсуждали планы, результаты, стратегические вопросы. А с Андреем были ближе к практике: разбирали самые сложные темы, смотрели код. Я очень ценю, что всегда могла обратиться за помощью — даже когда Андрей ушёл в отпуск.
Что касается общих созвонов, то мы не только рассказывали о своих результатах, но и охотно участвовали в обсуждении задач друг друга, предлагая новое. Генерация идей в команде не прекращается никогда. И неважно, что это за идеи: новый прототип продукта или вариант совместного досуга.
Так получилось, что моя стажировка проходила в трёх городах: Питере, Сочи и Москве. Везде мы проводили много времени с командой. В Питере ездили на шашлыки, катались на яхтах и картах, смотрели стэнфордские лекции по ML, ходили на AI-митап, готовили доклады внутри команды о деталях продуктовых запусков. А в Сочи катались на машинах по ночному городу, гуляли по скалам, поднимались в горы. И конечно, работали — ведь это был воркейшн: work + vacation.
Вы найдёте только то, что вы принесёте
Я шла на стажировку с мыслями, что у меня самый интересный проект во вселенной. А ещё с огромным желанием познакомиться с командой: я давно видела паблик с зарисовками из жизни команды и знала, что ребята там очень весёлые.
Одновременно с этим было много страхов. Переживала, что не справлюсь. Думала, что менторы не смогут уделять достаточно времени на ревью моего кода. Пришлось даже проговорить все опасения с психологом — только тогда я смогла расслабиться.
Стажировка превзошла все ожидания. Я не думала, что встречу так много поддержки от менторов и ребят в команде. В середине стажировки мы поняли, как сделать базовый синтез речи с эмоциями, и начали улучшать его качество. Это меня сильно вдохновило.
Теперь будь храбр и не оглядывайся назад
По итогам стажировки мне сделали оффер, и теперь я младший разработчик в команде прикладных исследований ВКонтакте. Сейчас я продолжаю исследовать эмоциональный синтез речи как штатный специалист. Обязательно потом поделюсь результатами в статье или на какой-нибудь важной конференции для ML-исследователей :) А может быть, мои наработки даже лягут в основу спецпроекта ВКонтакте — но не буду раскрывать всех секретов.
На стажировке я получила очень ценный опыт: меня ждал новый мир исследований, лучшие задачи, самые неравнодушные люди и, конечно, команда моей мечты.
Так что вот главный совет — действуйте! И тогда всё обязательно сложится.
Кто-нибудь прочитал от начала и до конца?
Этого не хватает)
Пролистал, и подробно рассмотрел фото из похода🤣
Есть видео?
Друг просит?
нет
Ага
Авторша безусловно молодец! Так держать! Но заголовок громковат. «Эгегей, мы тут рок-звезды, со стажерских пеленок!» Скажем так, когда увижу труды ВК в опенсорс, тогда и поговорим кто вы, рок-звезды или прикладники, делающие достаточно сложную, но тривиальную работу, адаптируя решения из недружественных стран.
Комментарий недоступен
Авторесса
Авториня.
Авториха
Сам себя не похвалишь...
А вы кто?
В этом посте прекрассно всё: и студентка, не изучившая классическое ML и пошедшая сразу в deep learning, выбравшая узкую область - так что теперь работать или в вк, или в ЦРТ, или в гугл пытаться устроиться
и ВК, возомнившие себя FAANG и фигачущие собесы по несколько месяцев.
У меня вызывают острую негативную реакцию компании, устраивающие больше 3х этапов собеседования (hr, тимлид, приёмка на работу).
Где вы прочитали, что она не изучила классическое МЛ? Автор написал, что закончила вышку и поняла, какая именно тема ее привлекает.
Александру просто все равно было, он хэштеги уловил, а дальше решил, что все как бы понятно и так. Тут, видимо, как с собесами: посты длиной больше, чем в 3 слова, вызывают острую негативную реакцию
"Функция потерь - это функция, к оптимизации которой обычно сводится любая задача машинного обучения, мы обычно хотим минимизировать или МАКСИМИЗИРОВАТЬ значение какой-то функции, и вот этой функцией мы называем функцию потерь"
https://youtu.be/DCplj0dE7Wk?t=693
Ну как бы 11 месяцев назад человек что-то выучил кусками про машинное обучение, но глобально ещё не понимал, чем он занимается и что читает с листка на камеру.
А самое угарное, что это в канале "Команда ВКонтакте" - сразу видно уровень "рок звёзд" - или поленились чекнуть запись на официальном канале, или же кто проверял - примерно такого же уровня понимания, о чём речь...
Лол)
5 месяцев собеседуют кандидатов, а потом берут человека по знакомству)
"А ещё я познакомилась с ребятами из прикладных исследований. Ваня Самсонов, продакт команды прикладных исследований, показал моё резюме Наде Зуевой, на тот момент она была техлидом по голосовым технологиям. И она согласилась стать ментором для моего диплома"
Я думаю, это просто неточная формулировка из-за краткости объяснения. Насколько я понимаю, некоторые задачи могут быть сформулированы как максимизация функции минус эф от икс, где эф от икс - функция потерь.
Нет задач в машинном обучении, где нужно максимизировать функцию потерь.
Помимо этого в докладе есть ещё один сильный ляп, не оговорка, а прям системный который даёт понять, что и стажёр, и ментор не понимают, какие инструменты каким образом используют.
Такие вот "рок звёзды".
Вы невнимательно меня прочитали.
В RL таких задач полно, я вообще не понимаю о чем тут разговор
если же это просто про формальное название "потерь", то хз, это даже смешно :D
С регистрацией вас!
терпеть не могу душнил, так что чувство социальной справедливости заставило
я так понимаю, что у тебя нет способности воспринимать профессионализмы и поэтому строго следуешь формально заученным определениям… в целом, пока до сих пор звучит душно, такие вот критики рок-звезд
Ну так вы если чушь несёте в докладе, какие тут профессионализмы?!!
а что не чушью было бы?
копетс ты душный, хз че еще на это ответить
Я продолжаю исследовать эмоциональный синтез речи в одном из заводских районов своего города, а чего добился ты?
Рок звёзды это кто там?
Комментарий недоступен
Без Блэкмора Дип Лёрнинг уже не тот...
По мне так отличная статья - мир дружба жвачка! Автор молодец - работай, трудись, расти. Всяких кислотных троллей побоку!
Автор искренне поделилась своим опытом достижения цели и выразила свою признательность тем, кто ей помог в этом. И это классно!
Рок-звезды – это те, кого все знают. А это кто?
На фото какие-то бездельники.
Upvote только за Егора
В чем сложность синтезировть речь? С распознаваним да.
хм… в синтезации? А что сложного в распознавании?
Спасибо за толковые советы.
Молодцы