Feature engineering и кластерный анализ клиентов на PySpark

Привет VC! С вами Анастасия Смолюк и Елена Путилова.

Кластеризация клиентов является важным инструментом, так как позволяет лучше понимать клиентов и предлагать им более персонализированный сервис, а также она может быть полезна для компании в поиске решения при возникновении проблем с клиентами.

11

Как искать текст в документах разных форматов по ключевым словам, используя Python?

Построение отчётов на основании большого количества файлов – рядовая задача. Но всё становится сложнее, если вместо одного формата исходных файлов, мы получаем кучу файлов разного расширения.

Ранее я говорил о том, как скачивали файлы из базы и распознавать их, здесь я расскажу о том, как вытаскивать информацию (для анализа данных для спринта…

3