Как начать карьеру в аналитике с нуля?
Всем привет! Я уже больше 10 лет работаю с данными, я работал в России, Европе, Канаде и США и создавал аналитические решения для различных секторов бизнеса. Но речь пойдет не обо мне или моем опыте. Мы поговорим, про то, как начать работать с данными, какие профессии бывают и какие перспективы у вас есть.
Понятие аналитика это термин включающий в себя технологии, инструменты и методологии для работы с данными . То есть в сердце аналитики находятся данные.
Откуда берутся данные? Данные создаются бизнес процессами, приложениями, системами, клиентами.
То есть, когда вы совершаете какое-то действие, например, заходите на сайт vc.ru или покупаете капучино в Starbucks, данные о вашем посещение или о покупке собираются для последующего анализа. Данные позволяют организациям анализировать ваше поведение, узнать ваши предпочтения, откуда вы пришли и многое другое.
Роль Аналитики
Если вкратце, то целью аналитики является:
1. Заработать больше денег
2. Сократить расходы
3. Исследовать новые рынки и продукты
4. Избежать/предсказать риски
Первый два пункта - самые главные. Неважно, у вас маленький стартап или у вас огромная компания. Вам необходимо собирать данные и отслеживать ключевые показатели. Например, количество активных покупателей, стоимость привлечения клиента, прибыль, расходы, и многое другое.
Навыки для работы с данными
Как правило, компании нанимают людей, у которых есть навыки для работы с данными, начиная от простых, таких как, Excel и заканчиваю сложными - создание моделей машинного обучения (ML). Между Excel и ML есть еще много навыков, которые вам помогут преуспеть, например:
- SQL - язык для работы с базами данных
- Python - популярный язык для работы с данными
- Business Intelligence - инструменты визуализации данных и создания отчетности
- Хранилище данных - база данных для консолидации всех данных
- Решения Big Data - противоположность хранилищам данных (например Озеро данных)
- Интеграция данных (ETL/ELT) - инструменты для сбора данных и загрузки в единый репозитория
- Облачные вычисления - технологии активно развиваются и компании все чаще использую облачные решения, например AWS, Azure, GCP или отечественные аналоги.
- Углубленная аналитика - data science, machine learning, deep learning и все что с этим связано.
Основные роли для работы с данными
Чтобы картина был более полноценной, необходим еще рассказать про основные вакансии, которые есть в индустрии и их обязанности.
- SQL разработчик/аналитик - специалист, которых отлично знает SQL, может написать сложные запросы, рассчитать показатели и помочь бизнесу быть эффективней.
- BI разработчик/инженер - человек который работает с бизнесом, и помогает извлекать пользу из данных, по средством инструментов BI. Например, можно создать удобный дашборд, и передать его бизнес пользователям, где они самостоятельно могут отслеживать бизнес показатели. Я сам работал долго BI разработчиком, и мне нравиться эта вакансия, потому что она на стыке ИТ и бизнеса. Есть огромное количество креативных задач.
- ETL разработчик - человек, который управляет процессом загрузки и трансформации данных
- Инженер Данных - современно название ETL разработчик. Данный специалист часто работает с облачными решениями, решениями BigData. Он строит, так называемые, data pipelines, то есть организовывает потоки данных и часто загружает их в хранилище данных или озеро данных, давая доступ BI разработчикам, аналитикам или бизнес пользователям.
- BigData инженер - специалист, который отлично знает решения Apache Hadoop и всю экосистему BigData. Может использоваться как синоним Инженера Данных
- Data Scientist, Аналитик данных, ML инженер - ребята, кто знает как извлечь с данных дополнительную пользу, которую не так просто заметить, они используют специальные алгоритмы, статистику и математику, чтобы создать модель, которая будет решать задачу классификации (например предсказать - перестанет клиент пользоваться сервисом или нет) или регрессии (например запланировать бюджет на следующий квартал).
Как начать обучение?
С одной стороны, все достаточно просто, есть данные, если инструменты для работы с ними, бери и делай, но с другой стороны, все сложно, так как сейчас в интернете огромное количество информации, платных курсов, которые используют "хайп" вокруг аналитики и продают вам дорогие курсы, обещают трудоустройство. Так же очень мало ресурсов на русском языке и мы часто теряемся в этом океане информации и терминов.
Я считаю, что лучший способ - это начать с простого, и двигаться к более сложным вещам.
Подход, в котором нужно платить, чтобы получить качественный контент уже устарел, и появляются новые модели, где можно учиться и развиваться бесплатно, помогая себе и другим и при этом менять индустрию. Сейчас много классных ресурсов, таких как Coursera, Edx, на которых есть курсы по аналитике, визуализации, машинному обучению и другим областям. Как правило западные ресурсы на английском языке. Но есть и отечественный ресурс - DataLearn, который поможет начать и разобраться с терминологией.
Вы можете найти подробную информацию про ресурс Data Learn на нашем сайте, и также посмотреть описание курса. Все материалы доступны в github (учебник) и youtube (видео лекции). Сейчас курсе уже почти 300 студентов, мы закончили 2 модуля. Есть много положительных отзывов, поэтому я хочу масштабировать ресурс дальше.
Хотите освоить востребованные навыки или улучшить существующие? Переквалифицироваться? Все в ваших руках!