3. К сожалению, больше века назад, когда произошла трагедия «Титаника», дела со сбором информации о пассажирах, пострадавших в кораблекрушении, обстояли не очень. Данные о многих людях были не полными, не точными, а о некоторых отсутствовали вовсе. Для очистки полученных данных выложим на холст виджет Impute из раздела Data. В его настройках укажем метод среднего, которым будем заменять отсутствующие или некорректные значения. Также передадим данные с выхода этого виджета на вход виджета Data Table, чтобы во второй вкладке, которая там появится, посмотреть на результат работы очистки:
Очень много вопросов к подобного рода решениям.
Основная «сложность» ДС отнюдь не в изучении пайтона (привет курс на 3 недели на любой образовательной платформе).
И уж тем более не в изучении интерфейсов операций в scipy, numpy и панде.
А те, кто не понимает суть производимых операций, конечно же, могут выдавать какое-то решение с помощью no-code инструмента.
Только потом ты получаешь дерьмовые выводы из-за того, что кто-то просто накликал по иконочкам.
Опыт и практика - самые важные этапы в процессе обучения. Одно только чтение теоретического материала не поможет стать хорошим DS специалистом. В любой области так, не только в ИТ.