В этом посте я расскажу, с чем вам придётся столкнуться на российских хакатонах, в пяти болезненных историях. Мой опыт включает как участие до пандемии в оффлайне, так и хакатоны, проходившие во время пандемии в онлайне или сейчас - в гибридном формате. Какие проблемы поджидают вас на хакатонах? Что делать и чего ждать от хакатонов, если до этого…
Я иногда выступаю на конференциях и других публичных мероприятиях, и меня часто спрашивают о том, как вообще начать обучение в ML, DS. За последние пару лет я собрал небольшой гайд — минимально достаточный набор материалов из того огромного пула, существующих курсов, видео, сайтов, книг, публично доступных лекций и многого другого.
Мне кажется, что пост может быть полезен как начинающим специалистам или студентам, так и опытным дата сайентистам или руководителям разного уровня. Я сам прошел путь от джуна до руководителя, и мне кажется, что польза может заключаться в следующем:
Предварительная обработка нацелена не только на решение имеющихся в данных проблем, но и на трансформацию данных таким образом, чтобы они могли быть наиболее эффективно использованы методами машинного обучения, и качество обученных моделей было высоким. Как правило, предварительная обработка помогает уменьшить объем анализируемых данных, создать…
В прошлом посте мы начали говорить о проблемах в данных и остановились на том, что некоторые проблемы в данных можно решить с помощью математических методов предварительной обработки данных. Еще раз отметим, что проблемы в данных могут стать барьером (искажать результаты, сделать применение невозможным) при применении методов машинного обучения и…
Это первая статья, надеюсь, из многих, но в ближайших нескольких постах я планирую поговорить о данных, проблемах в них, методах предварительной обработки с точки зрения машинного обучения и о задачах, которые машинное обучение может решать в промышленности. Информация из данного поста также доступна на английском языке по ссылке на медиуме.