Sociaro
91

Статья "Полный справочник для начала работы в Data Science"

В сети невероятное количество информации об искусственном интеллекте, машинном обучении, аналитике данных - статьи, научные материалы, блоги - но чему можно доверять? какая информация заслуживает внимания, а что читать вообще не стоит? Для тех кто только начинает погружаться в данные области, для тех кто постоянно учиться и пополняет знания мы будем публиковать переводы интересных зарубежных статей, которые рассказывают простым и не очень языком о том, что из себя представляют данные технологии, как применяются, о новинках в области и нестандартных подходах.

В закладки

Начнем со статьи Anne Bonner, которая была опубликована на портале Medium Towards Data Science.

Полный справочник для начала работы в Data Science.

Как я начала получать предложения о работе в data science менее чем за 6 месяцев.

Я хочу вам кое-что рассказать: есть более чем один способ начать работать в data science!

Не легко врываться в новую сферу, особенно если она такая сложная и многогранная, как data science. Мы живем в странное время, где даже понятие (и ожидания) data science разнится от компании к компании. То, что data science специалист должен был делать, должен был понимать, и типы компаний, которым нужны data science специалисты - все это находится в состоянии стремительной эволюции.

Почему вообще должен быть только один путь, которому нужно следовать?

Честно говоря, если вы пытаетесь ворваться в data science, я не могу представить себе лучшего времени, чтобы это сделать!

Очевидный ответ на вопрос (с чего начать в data science) это:

· Получите (и завершите) научную степень.

· Начните рассылать резюме.

Если у вас есть возможность получить диплом университета, сделайте это! При прочих равных условиях, высшее образование – самый надежный путь к началу работы в data science.

Но это не единственный, и возможно не самый лучший способ, так как он определенно работает не для всех. Поскольку я прошла путь от отсутствия навыков до получения предложений о работе и запросов на консультации менее чем за шесть месяцев, я решила поделиться своим необычным путешествием наряду с самой интересной информацией из невероятных историй, которые мы публиковали на Towards Data Science.

Мой совет? Не мешай сам себе и будьте увлечены процессом!

Это для тех, кто выбирает менее изъезженный путь.

Эта статья является частью Ask Me Anything серий на Towards Data Science. С тех пор как мы начали, мы получили множество интересных вопросов, и один из них действительно выделялся.

Как человек, которому посчастливилось прочитать много прекрасных историй успеха (и некоторых действительно великолепных историй не-совсем-успеха), я могу сказать с абсолютной уверенностью, что нет единственного правильного способа начать заниматься data science.

Я также могу сказать, что существует почти бесконечное количество людей, которые захотят помочь вам на вашем пути!

Что же вам надо сделать?

При наличии или без диплома, первым делом вам надо рассмотреть конкретную область data science, которая вас интересует.

Это не так просто, как вы могли бы подумать.

Термин «data science», когда это касается трудоустройства, охватывает достаточно гибкую и обширную область знаний и возможных вариантов карьеры уже сейчас! (Могу поспорить, что именно поиск работы в новой области — это то, почему вы сейчас читаете эту статью. Если вы здесь, чтобы разобраться в классических определениях «data science» и «data science специалист», перейдите в раздел комментариев.)

Например, вам может быть интересна определенная должность или область, которая фокусируется на:

• Анализ бизнеса

• Анализ данных

• Визуализация данных

• Финансовый анализ

· Анализ здравоохранения

• Рекомендательные системы

• Обработка естественного языка

• Обработка изображений

или множество других специализаций. Мы живем в странное время, когда большое количество компаний знает, что им нужно нанять data science специалиста, но не знает, чем эти специалисты занимаются. Воспользуйтесь этим преимуществом и найдите свою нишу! Вот фантастическая статья.

Теперь определите конкретные компании, которые занимаются тем, что вы хотите делать. Удостоверьтесь, что компании, которые вы нашли – это места, где вы бы были рады работать! Исследуйте их предыдущие вакансии и адаптируйте свой учебный процесс под их требования. Скорее всего вы увидите, что вам надо выучить Python или R, SQL, возможно AWS, Spark, Hadoop и так далее. Полезно будет узнать про методы и инструменты визуализации данных. В зависимости от того, что вас интересует, вам возможно нужно будет изучить такие концепции, как обработка естественного языка, распознавание изображений, техники машинного обучения и так далее. Вы можете обнаружить, что для работы, которую вы хотите нужен диплом магистра или докторская степень в определённой сфере знаний. Это важная информация! Если компания, в которой вы хотите работать, использует алгоритм для отбора кандидатов и ваше резюме не отвечает их требованиям, оно так и не дойдет до человеческих глаз.

Если вы хотите работать в одной конкретной компании, узнайте их требования к успешным кандидатам, сделайте список и начните отмечать пункты из списка по ходу обучения. Никогда не забывайте про силу знаний конкретной области! Этого не будет в описании вакансии, но изучите конкретные проблемы и задачи, с которыми сталкивается компания. В то же время обратите внимание на свои «социальные» навыки! Они могут серьезно выделить вас среди конкурентов. Если же у вас уже есть опыт общения, презентации, управления, говорения и так далее, то вы на шаг впереди своих оппонентов.

Если чувствуете себя достаточно смелым, свяжитесь с кем-нибудь из организации, в которой хотите работать. Отправьте email и обозначьте, что вы начинаете изучать эту сферу и хотите работать именно в их компании больше, чем где-либо еще. Спросите, что бы могло сделать вас идеальным кандидатом на будущую должность! Возможно, они не ответят, но готов поспорить, кто-то точно откликнется.

Если вы получили ответ, не важно какой, отправьте сообщение, скажите, как вы благодарны, за то что они нашли время вам ответить.

Нужно ли мне получать докторскую степень?

Если вы можете получить университетский диплом, получите его! Ничего не может заменить качественного образования и контактов, которые оно дает. Мы здесь публиковали прекрасные статьи от людей, которые воспользовались своим образованием по максимуму и стали завоевывать сферы data science, машинного обучения, искусственного интеллекта и другие.

Вполне возможно, что высшее образование сейчас не лучший для вас вариант. И это нормально! Докторская степень – это прекрасная вещь, и без сомнения, она может открыть для вас многие двери. Но наличие диплома – не гарантия того, что вы получите работу или будете отлично с ней справляться. Наличие высшего образования никоим образом не гарантирует, что вы будете успешным кандидатом на конкретную должность. Вот действительно хорошая статья о том, что из себя представляет отличный data science специалист.

Также нигде не написано, что нужен определенный уровень образования, чтобы стать data science специалистом. Было бы его наличие полезным? Конечно! Но все больше и больше людей сталкиваются с тем, что закончить хорошие онлайн курсы и собрать выдающееся портфолио проектов, которые вы продумали и развили сами, в сочетании с дополнительным опытом (предыдущий опыт работы, например) может быть эффективнее (если не больше), чем просто наличие какого-то диплома.

Вы можете найти бесконечное количество отличных статей и от писателей, которые выбрали немного нестандартный путь, и от писателей, которые готовы поспорить, что высшее образование не может в достаточной мере подготовить человека к реальному миру. Мы также публиковали статьи от авторов, которые глубоко изучили навыки, которые нужны чтобы стать data science специалистом (автор написал статью в 2018, но у него есть обновленная версия на 2019 год), а именно насколько нужен университетский диплом для работы в data science.

Но так было не всегда!

На протяжении долгого времени data science специалисты, были на самом деле учеными. Образование было критически важным! Однако сейчас, в связи с тем, что количество доступных данных непреодолимо и безудержно растет, а бизнесу необходимо осмысленно обрабатывать эти данные (а также стали доступны технологии, инструменты и библиотеки, которых просто на просто не существовало 10 лет назад), сфера data science изменилась.

Сейчас существует огромное количество бизнесов, которые где-то прочитали, что им нужны data science специалисты, но у них нет конкретных ожиданий и планов для data science команды. Многие компании, ищущие data science специалистов, на самом деле нуждаются в аналитике данных или в бизнес аналитике. Некоторые компании просто нуждаются в помощи, чтобы разобраться в огромном массиве данных, на котором они «сидят» и могут попросить вас построить простые предиктивные модели. Другие компании по сути ищут data инженеров или ML инженеров. Так как область сейчас очень подвижна и находится в фазе эволюции, университетский диплом больше не является обязательным требованием. Если вы умеете работать с данными компании, анализировать их, и правильным образом доносить результаты своих исследований и открытий, то вам уже не обязательно иметь докторскую степень.

Но если вы хотите получить реальную фору, то сделайте это, получите образование! Это вам только поможет.

В осеннем лесу разошлись две дороги… (Robert Frost)

Если, неважно по какой причине, магистратура/докторат не для вас, взгляните на огромное количество онлайн курсов! Конечно, не все они хорошие. Вам стоит изучить, на каких курсах учат тому, что вы хотите узнать, какие курсы популярны, какие с хорошими отзывами, на каких курсах учились успешные в индустрии люди, и так далее.

Если вы можете сосредоточиться и посвятить себя этому, нет никаких сомнений, что вы сможете получить работу в сфере data science до конца этого года.

Прежде всего, подумайте об удобном для вас стиле обучения! Некоторые люди лучше всего воспринимают информацию читая, некоторые слушая, другие смотря видео, а кто-то, делая упражнения. Кому-то легче искать ответы на вопросы самому, а кому-то нужны уже готовые ответы, чтобы посмотреть на них и работать в обратном направлении. Независимо от вашего стиля обучения, существует масса курсов, которые подойдут именно вам! (Однако несмотря на то, что вы выберете, убедитесь, что каждую строку кода вы печатаете сами. Это вы не сможете ничем заменить. Вы можете удивиться, но заставляя свои пальцы работать, вы очень эффективно вдалбливаете информацию в свою голову!)

Я настоятельно рекомендую начать с бесплатного обучения, чтобы удостовериться, что вам и правда нравится работа, а не только шумиха вокруг нее. Вы можете найти множество бесплатных ресурсов в интернете. Вот хорошая подборка бесплатных ресурсов!

Языки Программирования

Если у вас нет опыта кодирования, вам возможно понадобится найти какие-нибудь онлайн курсы, которые обучают интересующему вас языку программирования. Python и R – самые популярные среди data science специалистов. Существует целый ряд причин для выбора одного из них, но Python уже несколько лет является лидером области и будет вполне логично изучать его первым (разве что, вы уже знаете, что R обязателен для интересующей вас позиции). Выберите подходящий для себя язык!

Я рекомендую посмотреть:

• этот вводный курс по Python на Udacity

• попробуйте этот на Udemy (он не бесплатный, но Udemy постоянно делают скидки на курсы. Вы также можете найти там множество скидок и промокодов)

• пройдитесь по пути изучения Python в Codeacademy

Как вы могли понять, это то, что сработало для меня во время моего обучения, и я выбрал Python. Если у вас есть курсы, которые вам понравились, поделитесь ими в комментариях!

Если вы хотите начать учиться программировать, посмотрите вот эти ресурсы:

• Codeacademy

• Udacity (не так просто у них найти бесплатные курсы! Кликните на кнопку «Full Catalog» в раскрывающемся меню «Programs». Поищите конкретную тему, если хотите. На левой части экрана вы можете фильтровать информацию. Нажмите на «Select Program Details» и под «Type» вы можете выбрать «Free Courses.»)

Codewars

Coursera

SoloLearn

Всегда! Читайте, слушайте и смотрите.

Удостоверьтесь, что вы каждый день читаете хотя бы одну или две статьи и/или слушаете data science подкаст или смотрите data science видео. Вы можете читать статьи в ванной или слушать подкасты в кровати, как вам удобно, но главное делайте это. Воспользуйтесь невероятным кладезем знаний, который доступен в сети и помогает оставаться в курсе событий, освойтесь в языке data science. Конечно я рекомендую статьи на Towards Data Science, наш подкаст и наш канал на Youtube, но у вас есть множество других вариантов!

Мы не так давно опубликовали хороший рейтинг 20 лучших data science подкастов.

А теперь приготовьтесь заняться своими знаниями математики. Вам нужно чувствовать себя комфортно в статистике, линейной алгебре и базовой математике, как минимум. Не пугайтесь математики! Математические навыки крайне важны, если вы хотите работать в этой области. Освежите свои знания на Khan Academy или воспользуйтесь бесплатными курсами на Udacity.

В этой статье прекрасно описаны математические навыки необходимые для data science и как начать бесплатно изучать data science!

Найдите курс по data science!

Когда вы уже начали привыкать к выбранному языку программирования и немного освоились в статистике (как минимум), начните искать курсы по data science! Вам не нужно быть профессиональным программистом, чтобы начать проходить вводные онлайн курсы. Элементарное знакомство с data science поможет вам не чувствовать себя подавленным. Вам может быть полезно поискать курсы на Courseera, Udacity, Udemy и edX, или вас может заинтересовать Datacamp, Dataquest, Springboard или Elite Data Science. Кстати, Coursera дает возможность пробовать курсы бесплатно! Вы не получите официального сертификата по окончании, но вы получите информацию и знания, не потратив ни гроша. (В Coursera вы также можете обратиться за финансовой помощью)

У вас хорошо получается воспринимать информацию на слух? Знали ли вы, что вы можете таким образом учиться на Towards Data Science? Мы разделили наши лучшие статьи по темам, чтобы помочь вам узнать больше, в том темпе, в котором вам удобно!

Стипендии и скидки!

Все еще интересно работать в data science? Начните искать стипендии, конкурсы и соревнования! Вы никогда не поверите какое количество информации вы можете получить через стипендиальные программы и конкурсы. Я участвовал в конкурсе Bertelsmann Data Science Scholarship на Udacity, в Facebook AI PyTorch scholarship challenge, а также в Private AI scholarship challenge и таких программ существует огромное количество. Каждое такое соревнование дает на самом деле полезную информацию и возможность познакомиться с целым сообществом бесплатно.

Не забывайте социализироваться!!!

Старайтесь добавлять интересных людей с курсов и соревнований в LinkedIn! Когда будете этим заниматься, сделайте так чтобы ваш профиль LinkedIn выглядел хорошо. Заполните графу образования, сертификаты, навыки и добавьте проекты, которыми вы занимались. Качественно заполните секцию «о себе», чтобы она отображала, кто вы такой, и чем можете помочь другим людям. (Вы будете удивлены насколько к разным результатам приведут два, казалось бы, одинаковых предложения: «Я имею опыт в визуализации данных» и «Я могу помочь вам использовать ваши данные так, чтобы они рассказывали историю») Подтверждайте навыки людей, которых вы успели хорошо узнать, так как они, возможно сделают это в ответ.

Как только вы освоитесь с этой идеей, вы поймете, что пришла пора добавлять новые инструменты в ваш инструментарий. Невероятно важен SQL. Также, вам точно будет полезно начать осваивать техники визуализации данных. Конечно, существуют инструменты, которые, к этому моменту, вы уже использовали на онлайн курсах, кроме того, полезным будет ознакомиться с Tableau, если вы еще этого не сделали. Это популярный инструмент, особенно для новичков, так как он хорошо визуально передает анализ данных. Плюс ко всему, вам точно захочется изучить работы Git и GitHub, для этого существует множество онлайн-курсов. (Вот неплохой курс начинающих. Этот посвящен контролю версий и его чаще рекомендуют)

Начните изучать Kaggle! Не все его используют или участвуют в соревнованиях, но это крайне полезный ресурс для людей, которым интересно проверить свои навыки. Кроме того, работая успешно на Kaggle, вы можете оказаться в некоторых интересных ситуациях и обрести новые перспективы в карьере. Много людей тяжело работали над тем, чтобы собрать все лучшие советы и секреты для успеха на Kaggle, так что не думайте, что вам придется разбираться во всем самому.

Вам интересны хакатоны? Мы слышали множество прекрасных историй от людей, которые готовились и участвовали в хакатонах, и у некоторых из них есть достаточно поразительные истории.

За все надо платить.

Вы все еще с нами? Возможно, пришло время начать выбирать платные курсы. Я фанат Udacity Nanodegrees, но может быть вам захочется купить курсы от Coursera или edX. Вероятно даже вы захотите проходить курсы от Bootcamp.

Может быть вы захотите получить Udacity’s Data Science Nanodegree или их Machine Learning Nanodegree.

Также вас могут заинтересовать эти программы:

Мы публиковали хорошие истории от людей, которые посещали учебные лагеря (bootcamps) в:

· Metis

· И тех кто смотрел в общем на учебные лагеря, чтобы помочь вам определиться, какой лагерь подходит (а возможно это в принципе не для вас) именно вам.

Время проектов!

Теперь пришло время сконцентрироваться на проектах! Почистите свой профиль на GitHub. Убедитесь, что вы продвигаете коммиты по возможности каждый день и показываете лучшие из своих проектов. На этом этапе вы уже сделаете какое-то количество собственных проектов на курсах, и вам должно быть достаточно комфортно начать работать над собственными проектами. Найдите тему, которая действительно вас интересуют и постройте что-нибудь прекрасное или посмотрите на что-то с новой стороны! Решите проблему! Действительно вложите свои силы и сделайте этот проект своим. Вы никогда не знаете, куда вас может привести собственный проект.

Работа над тем, что вас волнует, даст вам то, о чем вы можете говорить по-новому, на новом уровне. Это поможет вам, когда вы будете налаживать контакты и во время собеседований!

Теперь начните вносить свой вклад в open source организации! Внесите свой вклад в организации на GitHub. У GitHub есть целая секция, посвященная проектам, в которые могут внести свой вклад новички! Вы можете поискать проекты с тэгом first-timers или beginner-friendly. У GitHub также существует солидный репозиторий, с отличными PR возможностями.

Найдите компанию, которой вы сможете реально помочь или которая вас очень интересуют и включайтесь в работу. Большинство open source компаний работают практически без бюджета и благодарны за любую помощь. Они хотят, чтобы у вас все получилось! Я работал с замечательными людьми из NumPy, и они искренне хотят, чтобы люди поняли, как можно им помочь и как работает весь процесс, так как хотят, чтобы люди помогали им в долгосрочной перспективе. Они не хотят, чтобы вы сдавались! Это не простой процесс, но они хотят, чтобы у вас все получилось, и вы продолжали оказывать им помощь.

Помогайте с известными проблемами, с документации, помогайте чем можете! Если вы найдете организацию, которая полностью устраивает вас и удовлетворяет ваши интересы, поставьте помощь им в приоритет. Неожиданно для себя вы можете оказаться в их команде!

(Выше нос! Вы проходите опыт, который потом выделит ваше резюме среди других!)

Я уже говорила это и скажу еще раз. Начните писать!!!

Пишите о том, что вы изучаете. Пишите, чтобы поделиться информацией и помочь другим людям. Вы поразитесь разнице между пониманием концепции и пониманием концепции достаточно хорошо, чтобы об этом писать. Также техническое сообщество инвестирует множество ресурсов на помощь другим людям (От open source компаний до Quora, Stack, Overflow и других) и вам будет полезно сделать свой вклад.

Лично от себя: для новичка лучший способ быть замеченным – писать! Возможности, которые я получил после написания статей просто ошеломляют. Мне предлагали работу консультантом, выступать спикером, писать и редактировать работы, позиции учителя и наставника, работу в data science, и многое другое, только благодаря моим статьям.

Просыпайтесь!

Итак, теперь у вас есть хорошие проекты, о которых вы можете подробно рассказывать, какое-то количество статей, демонстрирующих ваши знания, основательный профиль на GitHub, несколько сертификатов с вашим именем, вы вкладывались в работу open source компаний, и возможно даже поучаствовали в одном или двух соревнованиях от Kaggle, либо в хакатоне. У вас заполненный профиль в LinkedIn, который демонстрирует ваш опыт, навыки и связи. Плюс ко всему (я надеюсь) вы дополняли свое резюме проектами, навыками, опытом работы в open source, и оно готово к старту.

Чего же вы ждете?

Выбирайтесь и начинайте общаться с людьми! Хоть конечно и весело вслепую отправлять свое резюме сотням компаний, которые рекламируют вакансии и используют алгоритмы и рекрутеров для отбора кандидатов, вы можете обнаружить, что самый быстрый (и наименее болезненный) способ получить работу – в живую пообщаться с кем-то из компании!

Помните те письма, которые вы отправляли в начале всего процесса? Свяжитесь с теми людьми снова и еще раз поблагодарите за помощь. Напомните им кто вы такой, и дайте знать, чего вы добились за такое короткое время. Упомяните как вы были бы рады пообщаться с кем-нибудь из их компании. Продемонстрируйте свои навыки общения, умение следовать советам, и свою целеустремленность. Посмотрите какой ответ вы получите!

Пообщайтесь с людьми, из ваших стипендиальных программ и курсов, которые нашли хорошую работу, узнайте, чему они научились. Вам возможно также захочется пообщаться с кем-то из open source компаний, которым вы помогали. Кто знает, может быть они даже смогут порекомендовать вас на какую-нибудь классную должность. Это фактически то, что из себя представляет LinkedIn!

Для интровертов, либо людей с низкой самооценкой… Никогда не забывайте, что есть море компаний, которые предлагают реферальный бонус людям, которые успешно рекомендуют кандидата на открытые вакансии. Кто-то из ваших связей может быть заинтересован в небольшом таком заработке...

Также запомните, что люди не знают вещей, которые вы им не рассказываете. Вы знаете, кто из ваших друзей в LinkedIn ищет работу? Знаете ли вы сколько других людей из open source компаний активно пытаются найти работу? Скорее всего нет! Нам нравится предполагать, что люди и так все о нас знают, но это не так. Заговорите! Вас может удивить, насколько много людей будут счастливы помочь вам, если могут.

Что теперь?

Прекратите прокрастинировать! Выбирайтесь из своей зоны комфорта и начинайте работать в data science!

Спасибо за то, что прочитали статью!

{ "author_name": "Sociaro", "author_type": "self", "tags": [], "comments": 0, "likes": 5, "favorites": 7, "is_advertisement": false, "subsite_label": "unknown", "id": 123272, "is_wide": true, "is_ugc": true, "date": "Thu, 07 May 2020 07:24:13 +0300", "is_special": false }
Трибуна
ApiX-Drive — онлайн-коннектор разных сервисов и приложений между собой без программистов
Рассказываем, как запустили аналог Zapier за три месяца.
Объявление на vc.ru
0
Комментариев нет
Популярные
По порядку

Прямой эфир