{"id":14189,"url":"\/distributions\/14189\/click?bit=1&hash=147ff0d5ac0f8c07ad1a391b0e132691bcf1d8d392194cece93eed2312f6b819","title":"\u0410\u043d\u0430\u043b\u0438\u0442\u0438\u043a\u0430 \u2014 \u043a\u043b\u044e\u0447 \u043a \u0443\u0441\u043f\u0435\u0445\u0443 \u043d\u0430 \u043c\u0430\u0440\u043a\u0435\u0442\u043f\u043b\u0435\u0439\u0441\u0430\u0445","buttonText":"","imageUuid":""}

Предобработка данных

Прошла двухнедельный спринт… За 6 дней. Всего-то надо было работать по 12 часов в день.

Идеальных данных не бывает. Их надо сначала подготовить к анализу: человеческий фактор, системные ошибки, ошибки выгрузки могут их «испортить» - сделать непригодными для анализа. Вот для этого и нужна предобработка.

Что я изучила в теории.

Работа с пропусками, определение аномальных значений, преобразование типов данных, методы поиска дубликатов, работа с несовершенными реальными наборами данных.

Финальный проект. Состоял из двух частей. Первая - решение задач с автопроверкой. И вторая - проект 'Исследование надежности заемщиков' с анализом данных и указанием аргументированного мнения и вывода📊. Эта часть проверялась ревьюером. Оценивалось не только владение нужными командами, но написание правильного, легкочитаемого кода, логического вывода и комментарии каждого шага. После 2 ревью мой проект был принят.😎

Следующий шаг: по Python - отправила на ревью проект 'Docker'. Читаю учебник по DS📙.

0
Комментарии
-3 комментариев
Раскрывать всегда
null