Yuriy Katser

+56
с 2022

Эксперт по DS/ML в задачах промышленности.

46 подписчиков
3 подписки
5 историй с хакатонов
Победа на хакатоне Цифровой прорыв в 2019 году

В этом посте я расскажу, с чем вам придётся столкнуться на российских хакатонах, в пяти болезненных историях. Мой опыт включает как участие до пандемии в оффлайне, так и хакатоны, проходившие во время пандемии в онлайне или сейчас - в гибридном формате. Какие проблемы поджидают вас на хакатонах? Что делать и чего ждать от хакатонов, если до этого у…

11
Источники для изучения data science и machine learning (книги, курсы и не только)

Я иногда выступаю на конференциях и других публичных мероприятиях, и меня часто спрашивают о том, как вообще начать обучение в ML, DS. За последние пару лет я собрал небольшой гайд — минимально достаточный набор материалов из того огромного пула, существующих курсов, видео, сайтов, книг, публично доступных лекций и многого другого.

3333
Список материалов и кейсов применения ML и DS в промышленности

Мне кажется, что пост может быть полезен как начинающим специалистам или студентам, так и опытным дата сайентистам или руководителям разного уровня. Я сам прошел путь от джуна до руководителя, и мне кажется, что польза может заключаться в следующем:

GitHub репозиторий проекта
1616
Методы предварительной обработки данных для машинного обучения

Предварительная обработка нацелена не только на решение имеющихся в данных проблем, но и на трансформацию данных таким образом, чтобы они могли быть наиболее эффективно использованы методами машинного обучения, и качество обученных моделей было высоким. Как правило, предварительная обработка помогает уменьшить объем анализируемых данных, создать до…

Этапы, методы и подходы к предварительной обработке данных
11
О проблемах в промышленных данных

В прошлом посте мы начали говорить о проблемах в данных и остановились на том, что некоторые проблемы в данных можно решить с помощью математических методов предварительной обработки данных. Еще раз отметим, что проблемы в данных могут стать барьером (искажать результаты, сделать применение невозможным) при применении методов машинного обучения и п…

При отсутствии или изменении частоты дискретизации становится невозможным применить какой-либо способ анализа временных рядов, где требуется регулярность временной сетки.
22
О качестве данных для машинного обучения

Это первая статья, надеюсь, из многих, но в ближайших нескольких постах я планирую поговорить о данных, проблемах в них, методах предварительной обработки с точки зрения машинного обучения и о задачах, которые машинное обучение может решать в промышленности. Информация из данного поста также доступна на английском языке по ссылке на медиуме.

Часто можно увидеть следующую картину (<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DWbPcXEmA6-Q%26amp%3Blist%3DWL%26amp%3Bindex%3D14&postId=405005" rel="nofollow noreferrer noopener" target="_blank">источник</a>)