Предобработка данных

Прошла двухнедельный спринт… За 6 дней. Всего-то надо было работать по 12 часов в день.

Идеальных данных не бывает. Их надо сначала подготовить к анализу: человеческий фактор, системные ошибки, ошибки выгрузки могут их «испортить» - сделать непригодными для анализа. Вот для этого и нужна предобработка.

Что я изучила в теории.

Работа с пропусками, определение аномальных значений, преобразование типов данных, методы поиска дубликатов, работа с несовершенными реальными наборами данных.

Финальный проект. Состоял из двух частей. Первая - решение задач с автопроверкой. И вторая - проект 'Исследование надежности заемщиков' с анализом данных и указанием аргументированного мнения и вывода📊. Эта часть проверялась ревьюером. Оценивалось не только владение нужными командами, но написание правильного, легкочитаемого кода, логического вывода и комментарии каждого шага. После 2 ревью мой проект был принят.😎

Следующий шаг: по Python - отправила на ревью проект 'Docker'. Читаю учебник по DS📙.

Начать дискуссию