Лучший курс вкатиться в Data Science?

Лучший курс вкатиться в Data Science?

Особенность курса

В первую очередь, мне понравилась сама идея курса — развивать интуицию для понимания Data Science. Это сильно отличается от всех классических курсов по машинному обучению. В классических курсах ты начинаешь изучать алгоритмы машинного обучения, как они работают, и математику, которая стоит за ними. Глеб предлагает использовать машинное обучение как инструмент для решения задач.

Чтобы понять, зачем использовать машинное обучение, автор курса сначала реализует «человеческое обучение» — относительно простой алгоритм, который может придумать человек для решения задачи. Затем Глеб делает машинное обучение, используя CatBoost, и сравнивает два варианта алгоритма. Попутно объясняет особенности использования алгоритмов машинного обучения.

Практика. Вместо привычных решений задач прямо на платформе, Глеб создал два соревнования на Kaggle. Это отличный способ проверить полученные знания на практике.

Чекап по Python и Pandas

Первый блок на курсе это чекап по Python и Pandas. Отличная возможность размяться для тех кто уже сталкивался с данными инструментами. Для остальных — это минимум того, что нужно для того, чтобы крутить модели машинного обучения. Вспомнить типы данных в Python, потренироваться делать сводки в Pandas и научиться удобно загружать данные в Google Colab.

Также интересно, как автор курса позиционирует Python и Pandas в контексте машинного обучения. Python и Pandas — это аналитический инструмент, как Excel, например, только без интерфейса. И пользователю нужно обучиться командам для взаимодействия с инструментом.

Машинное обучение

Курс по машинному обучению состоит из двух блоков. Один блок посвящён проблеме регрессии, второй блог — классификации. Глеб не объясняет как работает алгоритмы. Он берет CatBoost и объясняет как работает data science. Рассказывает об основных метриках ошибок, показывает как их анализировать. Большое внимание уделяется интерпретации результатов модели, что не мало важно если ты хочешь использовать CatBoost в реальной жизни. Автор курса подсвечивает, то что могу спросить на собеседовании. Полезно для тех кто планирует искать работу в сфере DS. После прохождения можно сформировать фреймворк с использованием CatBoost, для решения задач регрессии и классификации.

Советы по прохождению курса

Слушать лекции и дублировать код самому.

У Глеба есть репозиторий со всеми ноутбуками из курса, но набирать код самому полезнее. Вы запоминаете синтаксис языка и нарабатываете мышечную память. Это также помогает лучше понять теорию или идею, которая объясняется в лекции.

Как это работает для меня: Я слушаю лекцию, ставлю паузу, если необходимо, и пишу код. Чтобы написать код, мне нужно понять, «что должно произойти» после выполнения. Если что-то идет не так, я разбираюсь. Так я выделяю неочевидные для себя места.

Писать конспект.

Используйте Markdown ячейки для конспектирования лекций. Я не конспектирую все лекции, а расписываю своими словами вещи которые могу забыть. Записываю то, что для меня не очевидно с первого взгляда. Из-за того, что у меня написан код и есть краткий конспект, мне легче вспомнить, что происходит.

Комментировать код.

Комментируйте код, насколько это возможно. После нескольких дней перерыва можно забыть, для чего предназначен код. Комментарии могут помочь в этом случае.

Итог

Это действительно отличный курс, что бы развить интуицию. Во время прохождения возникали идеи, где можно применить тот или иной подход у себя на работе. У Глеба интересная подача и определенный талант рассказчика. Если вы хотели погрузиться в мир Data Science, а обычные курсы вам кажутся сложными и скучными — попробуйте Data Science с Глебом Михайловым.

Связь: подписывайтесь на телеграм канал, либо загляните в мой блог.

А у вас есть любимые курсы? Пишите в комментариях свои рекомендации.

2 комментария

В таких статьях было бы хорошо начинать с "конфликта интересов". А "лучший курс вкатиться в Data Science" — изучить статистику и регрессионый анализ для начала. Нужны фундаментальные знания, а понимание на уровне перебрать доступные алгоритмы в библиотеке закончатся скорой заменой таких специалистов на AutoML.

Конфликта нет, слушатель курса и только. Но на будущее учту. Спасибо.👍🏽
Автор курса кстати даёт рекомендации куда смотреть после прохождения