{"id":10642,"title":"\u0411\u0438\u0437\u043d\u0435\u0441 \u043c\u043e\u0436\u043d\u043e \u0437\u0430\u0449\u0438\u0442\u0438\u0442\u044c \u043e\u0442 \u043a\u0438\u0431\u0435\u0440\u0430\u0442\u0430\u043a \u0438 \u0432\u0438\u0440\u0443\u0441\u043e\u0432 \u043d\u0430 \u0443\u0440\u043e\u0432\u043d\u0435 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u043e\u0440\u0430","url":"\/redirect?component=advertising&id=10642&url=https:\/\/vc.ru\/promo\/305439-reshenie-dlya-biznesa-zashchitit-rabochie-kompyutery-i-tratit-menshe-na-tehpodderzhku&placeBit=1&hash=92cac90aee476dcf6c798d57554c147c48c9992484e9b9517cc9679e918eca49","isPaidAndBannersEnabled":false}
Карьера
Айра Монгуш

Как самостоятельно выучиться на дата-саентиста, не бросая на ветер деньги

Меня зовут Айра, я веду блог про математику, продукты и ML в Instagram, делаю проекты в DS/ML, а также курсы по созданию ML-проектов. От своей аудитории блога и знакомых часто получаю вопросы в духе "Cтоит ли тратить деньги на тот или иной дорогой курс с codename «Стань DS за два месяца» или все же выучиться на дата-саентиста самостоятельно и бесплатно, и в таком случае, с чего начать?"

Недавно собрала ответ на этот вопрос достаточно развернуто, на мой взгляд, чтобы поделиться им с широкой аудиторией. Не все платные курсы плохие (хотя большинство — да — из-за механизмов отбора, продаж и слабой программы), но о них напишу отдельно. Мне кажется, нужно учитывать больше персонализированных параметров для того, чтобы грамотно выбирать хороший курс за деньги.

— Во-первых, в список вошли бесплатные онлайн-курсы и ресурсы для самостоятельного обучения, которые проходила сама или советует профессиональное сообщество аналитиков и дата-саентистов (часто упоминающиеся в ODS.ai), где не нужно проходить какой-то отбор или быть ограниченным офлайн-посещением.

— Во-вторых, конечно, это далеко не полный список онлайн-курсов, который вы можете встретить, зато в него попали лучшие курсы от сильных математических и Computer Science-школ мир и другие распространенные ресурсы среди профи из того, что я смогла отфильтровать на свой вкус.

— В-третьих, начну с рекордно короткого списка, с которого, как мне кажется, стоит начинать обучение предмету, и он идет сразу же следующим абзацем:

С чего советую начать, чтобы тратить время эффективно?

Предполагая, что начинающий дата-саентист уже прошел подготовительные курсы а-ля гарвардский CS50 по основам программирования, pythontutor.ru или курс на Stepik от Института Биоинформатики, посоветую несколько шагов, которые должны стать твердой базой. Далее ссылки все полные, чтобы было легче копировать:

  • Зарегистрироваться в самом популярном в СНГ профессиональном slack-сообществе Open Data Science ODS.ai, вступить в как можно больше чатов, в том числе про менторство, обучение и карьеру и общаться с местными, чтобы расширить свой кругозор относительно работодателей, требований к прохождению интервью, к позиции и их различиях в разных компаниях и др, найти хороших наставников, тк. такие в сообществе есть!
  • Пройти вводный курс «Математика и Python для анализа данных» на Coursera — платный, недорогой и хороший. www.coursera.org/learn/mathematics-and-python
  • По программированию — пройти в leetcode.com все релевантные упражнения: это бесплатные или недорогие в премиальной версии в соотношении цена/качество тренажеры (в нем есть в том числе упражнения на интервью в FAANG).
  • Пройти mlcourse.ai — это открытый курс машинного обучения от ODS. Авторы смогли разработать курс машинного обучения с балансом между теорией и практикой, когда в лекции вы разбираете достаточно подробно математику, а затем упражняетесь сначала в блокноте, затем на Kaggle.
  • Для обучения решению разнообразных задач и оптимизации кода — участвовать в соревнованиях по анализу данных и машинному обучению на платформе kaggle.com.

Математика для DS/ML

  • Приятный курс Стэнфорда по DS "Introduction to Statistics" www.coursera.org/learn/stanford-statistics
  • Коротенький интерактивный курс по теории вероятностей и математической статистике "Seeing Theory" seeing-theory.brown.edu/
  • Хороший вводный курс по математике для анализа данных, более объёмный "Специализация Математика для анализа данных:. Можно послушать только интересную тему: дискретная математика / линейная алгебра / математический анализ / теория вероятностей. www.coursera.org/specializations/maths-for-data-analysis

Python&SQL для DS/ML

  • Упомянутый выше бесплатный тренажер по Python с нуля: pythontutor.ru/
  • Отличный курс по инструментам по DS от IBM "Специализация Data Science Fundamentals with Python and SQL" www.coursera.org/specializations/data-science-fundamentals-python-sql
  • Упомянутый выше русский курс по питону и математике (платный, недорогой и хороший) "Математика и Python для анализа данных (Coursera)" www.coursera.org/learn/mathematics-and-python
  • Упомянутый выше https://leetcode.com/: пройти все релевантные упражнения, это бесплатные или недорогие в премиальной версии в соотношении цена/качество тренажеры (в нем есть в том числе упражнения на интервью в FAANG).

Начальные курсы по ML

  • Как бы этот курс не ругали из-за устаревшего языка программирования Octave (на котором пишут на Matlab), на мой вкус — это пока что самый простой и понятный курс по ML. Машинное обучение (Coursera) https://www.coursera.org/learn/machine-learning — стэнфордский курс по машинному обучению от Andrew Ng
  • mlcourse.ai — это открытый курс машинного обучения от ODS. Авторы смогли разработать курс машинного обучения с балансом между теорией и практикой, когда в лекции вы разбираете достаточно подробно математику, а затем упражняетесь сначала в блокноте, затем на Kaggle.

Более продвинутые курсы по ML

  • Если хочется погрузиться в математические доказательства методов машинного обучения, то есть прекрасные ШАДовские лекции К.В. Воронцова: плейлист "Курс «Машинное обучение» 2019” на YouTube-канале “Компьютерные науки», www.youtube.com/watc? v=SZkrxWhI5qM&list=PLJOzdkh8T5krxc4HsHbB8g8f0hu7973fK&index=2
  • Также хорош ежегодный гарвардский курс «Advanced Topics in Data Science CS109B». harvard-iacs.github.io/2020-CS109B/
  • Или курс по углубленным алгоритмам Advanced ML от ВШЭ: «Специализация Продвинутое машинное обучение» www.coursera.org/specializations/aml

Deep learning

(Мне кажется, можно пройти один курс из списка, а остальные смотреть на предмет дополнений)

  • Рекомендованный Стэнфордовский курс по DL «CS231n: Convolutional Neural Networks for Visual Recognition» cs231n.github.io/
  • Хороший курс от Университета Карнеги—Меллон "11-785 Introduction to Deep Learning" deeplearning.cs.cmu.edu/F21/index.html
  • Курс от MIT: «Practical Deep Learning for Coders» https://course.fast.ai/
  • ШАДовский курс по глубокому обучению доступен в github: «Practical_DL» github.com/yandexdataschool/Practical_DL
  • Бесплатные классные курсы от МФТИ: dlschool.org/
  • Также есть курс по DL у ODS.ai, который тоже советуют проходить в самом сообществе: «Deep Learning на пальцах» dlcourse.ai/

Natural Language Processing

Reinforcement Learning & Self-driving cars

Data Engineering & MLOps

  • Бесплатный курс по DE от Дмитрия Аношина, дата-инженера из Microsoft, ex-Amazon: Getting start with Data Engineering and Analytics https://datalearn.ru/ (курс готовится in progress)

Соревнования

Ну, и для обучения решению разнообразных задач и оптимизации кода — участвуйте в Kaggle. https://kaggle.com/

Кроме Kaggle, есть еще несколько соревнований:

Подписывайтесь на мой блог, если было полезно.
Успехов в самостоятельной подготовке!

0
4 комментария
Популярные
По порядку
Baylak

Отличная статья!

Ответить
1
Развернуть ветку
Айра Монгуш

Спасибо!

Ответить
0
Развернуть ветку
Lagutin Ilya

Полезные ссылки в одном месте, спасибо!

Ответить
1
Развернуть ветку
Saglai Sandanchik

Спасибо за ссылки - кратко и удобно. Ну, что же приступим :)

Ответить
1
Развернуть ветку
Читать все 4 комментария
Сооснователь Nginx Игорь Сысоев покинул компанию Статьи редакции

В заявлении он объяснил, что теперь будет проводить больше времени с семьёй и друзьями.

Креативные индустрии будут расти по плану

В РСПП обсудили проект Плана по реализации Концепции развития креативных индустрий, подготовленного Министерством культуры РФ с участием Комитета по интеллектуальной собственности и креативным индустриям и Федерации креативных индустрий.

Образование, путешествия и благотворительность: на что тратились россияне в новогодние каникулы

Новогодние праздники — один из самых расточительных периодов года. Аналитики CloudPayments выяснили, какие категории товаров были самыми популярными в онлайне с 31 декабря по 9 января.

Российские акции на Мосбирже упали на 6,5%: такого падения за день не было с начала пандемии, больше всех задело банки Статьи редакции

Индекс ещё упадёт, но затем будет «бурный отскок», считают эксперты.

Гендиректор Activision Blizzard Бобби Котик объяснил сотрудникам сделку с Microsoft — это шаг к созданию метавселенной Статьи редакции

Он заявил, что компания за 31 год создала сообщества из сотен миллионов игроков. Следующий шаг — объединить эти сообщества.

Я задолбался гадать и решил спросить VC

О чем это все

Digital Horizon вложился в поставщика инфраструктуры для инвестиционных решений WealthKernel в раунде A+ на $ 7 млн

Привлеченные средства компания использует для выхода на европейские рынки, запуск внутридневной торговли и дальнейшее развитие API-инфраструктуры.

Команда WealthKernel
Работа только для взрослых: чем занимается кавист и как им стать

Кавист — это специалист по вину и другим видам алкоголя, который работает в торговом зале. Он управляет поставками и размещением товара на полках, а еще консультирует покупателей: помогает выбрать лучшее. Мы решили рассказать о том, как устроена профессия и где учатся на кависта. А в конце — парочка полезных советов по выбору вина для всех…

Цены на Wildberries с айфонов выше, чем на компьютере или андроиде

Торгуем на маркетплейсах. Вчера с удивлением обнаружили, что один и тот же товар выводится с разными ценами: на компьютере и андроиде - та цена, которую устанавливали мы, на айфонах - на 5-15% дороже.

Банки Wall Street ожидают более агрессивных действий от ФРС

В США за последние 40 лет потребительская инфляция достигла угрожающих значений

Microsoft объявила о планах купить разработчика игр Activision Blizzard за $68,7 млрд Статьи редакции

Акции игровой компании выросли на 38% на премаркете на фоне новости.

null