Когда пора внедрять Data Science: три кейса из e-commerce, кредитования и контекстной рекламы

Выпускники и студенты направления Data Science онлайн-школы Skillfactory рассказывают, в чём работа их компаний стала лучше после погружения в большие данные.

Кейс 1: выдавать кредиты только тем, кто их вернет

Павел Нагорный работал бизнес-аналитиком в сфере кредитных рисков. К data science его привела рабочая задача: нужно было понять, вернёт клиент кредит или нет. В терминах профессии это называется «спрогнозировать дефолт по клиенту».

Определить это можно на основе статистики, и нужно было решение, работающее в режиме реального времени.

«Я работал в основном с SQL и на базе этого языка строил отчёты в Power BI или в Excel. Иногда я обращался к Python, знал основные конструкции языка, функции и словари.

Я начал самостоятельно искать методы, нашёл варианты решить задачу с помощью логистической регрессии, случайного леса. Мне стало интересно, и я начал копать: читал статьи на „Хабре“, чтобы понять концепцию, на Stack Overflow искал конкретные куски кода. Но в итоге мой код представлял собой набор разных заплаток, порой я копипастил бездумно, и в какой-то момент у меня возникла потребность в понимании кода».

В итоге он решил изучить data science, чтобы добрать необходимые знания и сэкономить время:

«Если раньше я по минимуму работал с Python, то сейчас я решаю 90% задач при помощи этого языка: извлечение, обработка, визуализация данных, построение моделей оценки кредитоспособности, выявления мошенничества. Обработка данных в Excel занимала много времени, Python помогает делать это значительно быстрее.

После курса я остался в сфере кредитных рисков, но сменил работу. Это IT-компания, которая специализируется на финтехе, автоматизации бизнес-процессов компаний финансового сектора. Сейчас я занимаюсь непосредственно data science и ничем больше. С расширением навыка и сменой должности мой доход вырос на 50 тысяч».

Кейс 2: строить собственные модели атрибуции и прогнозировать продажи в e-commerce

Дмитрий Дружнов работает веб-аналитиком и специализируется на проектах e-commerce. Набора привычных инструментов — Google Analytics, «Яндекс.Метрика», Google Data Studio — перестало хватать, и он обратился к Python.

«Нужно получать сырые данные с использованием API из сервисов „Яндекса“ и Google, проводить разные виды статистического анализа, строить собственные модели атрибуции, не ограничиваясь стандартным набором сервисов.

Также передо мной стоят некоторые специфические задачи отчётности и постоянного контроля, например анализ множества разных xml-документов. Теперь я знаю производительный и экономичный инструмент, который помогает решать такие задачи. Мой бэкграунд к началу курса ограничивался программированием в вузе, который я окончил более 10 лет назад. Тем не менее делать приличные и сложные вещи на Python я смог уже через 2–3 месяца после начала курса».

Известные на рынке сервисы и компании уже внедряют машинное обучение. «Яндекс.Метрика» использовала алгоритмы ML для предсказания конверсии: совершит ли пользователь покупку в течение ближайших 7 дней. Точно так же можно предсказать чек, LTV и выбор покупателей — даже если модель будет не на 100% точна, данные помогут сэкономить рекламный бюджет.

Ещё примеры: Avito увеличил количество контактов на 10%, улучшив с помощью алгоритмов машинного обучения ленту рекомендаций, «М.Видео» оценивал вклад онлайн-рекламы в офлайн-продажи и оптимизировал бюджет с помощью ассоциированных конверсий, в X5 Retail Group предсказали розничный товарооборот.

Применение инструментов data science в ретейле и маркетинге — отдельная большая тема, и чем дальше, тем проще и дешевле внедрять их в бизнес и тестировать.

Кейс 3: давать понятные задания разработчикам и быстрее делать сложные отчёты

Александр Поляков работает в собственном рекламном агентстве Artwist с 2013 года, в 2017-м выпустил свою систему автоматизации рекламы Zoomkit. В начале карьеры он получил сертификат Google Analytics после обучения у Алексея Макарова (сейчас Алексей — ментор в SkillFactory), а потом заметил, что его наставник часто пишет в блоге про API «Яндекс.Метрики» в связке с Python — например, как быстрее и проще считать показатели retention для клиентов.

Любознательность и желание отвечать современным запросам рынка сподвигли изучить основы Python, а потом пройти ещё несколько курсов: Machine Learning, Deep Learning, «Python для разработки» — все у SkillFactory. Теперь Александр часто использует Python в работе для ускорения и оптимизации процессов:

«Основное применение полученных знаний сейчас — это быстрое и наглядное объяснение разработчикам, чего я от них хочу. Я просто закидываю на GitHub работающий прототип на Python в качестве ТЗ, и они сразу понимают, что нужно сделать.

Например, я хочу отслеживать аномалии в отчётах на автомате. Если я начну объяснять это голосом, придётся рассказывать, что такое аномалии, на что влияет уровень значимости. А так разработчики один раз посмотрят прототип, и это сэкономит нам кучу времени.

Или вот, корректировка ставок: обычный сотрудник может их проверять и актуализировать раз в день, а робот — каждые 30 минут. И объяснить принцип его работы человеку, ни разу не работавшему с рекламой в „Директе“, намного проще через прототип, чем словами».

Ещё одно применение — вывод сложных аналитических отчётов для клиентов. В одном из проектов Александр выгружает отчёт по пути пользователя — от первого касания до последней покупки. Его можно сделать в Google Sheets или любом табличном процессоре, но они медленные и долго просчитывают цепочки — до 30 минут. А с помощью Python такой отчёт генерируется 40 секунд.

Изучение data science — боль, но полезная и продуктивная

Если поняли, что работа с большими данными улучшит показатели вашего бизнеса, даст качественный толчок вашей карьере и поможет оптимизировать затраты на рекламу и производство, значит, пора осваивать data science и выбирать подходящий курс — например, у нас в SkillFactory.

Можно проходить обучение последовательно, как сделал Александр: сначала основы Python, математики и статистики, потом перейти на более сложный уровень — Machine Learning, «Deep Learning и нейронные сети», Data Engineering.

Если есть время и возможность, лучше проходить одну большую комплексную программу: ещё больше практики, больше работ в портфолио после выпуска, как следствие — выше вероятность сразу после курса перейти на новую должность или внедрить больше рабочих инструментов в нынешнюю работу.

Но во взрослом возрасте, когда нужно совмещать работу, учёбу и личную жизнь, это будет нелегко: придётся искать компромиссы. Персональный ментор отвечает на вопросы, направляет и помогает справляться с трудностями, но искать мотивацию и время на учёбу придётся самостоятельно. Студенты поделились своими мыслями и советами на эту тему.

Павел Нагорный: «Я жертвовал в пользу обучения хобби, встречами с друзьями. Но я понимал, что это временно и что чем быстрее я с этим расправлюсь, тем быстрее всё вернётся в прежний режим.

Вам будет не хватать времени, будут посещать мысли, что это слишком тяжело, что это не для вас. Возможно, в какой-то момент вы перестанете понимать, что происходит, у вас будет состояние, когда не можешь даже сформулировать вопрос преподавателю или ментору.

Новичкам я могу дать три совета: быть готовыми к боли, не лениться и не сдаваться. Очень много навыков придётся осваивать практически с нуля, потому что наша модель образования не позволяет вам понять, для чего нужна математика, для чего считать производные и зачем нужен предел. Хорошо, если у вас осталась школьная или вузовская база, но многое придётся вспоминать или учить заново. Будет непросто, но оно того стоит».

Всеволод Шантаренков, экономист: «Я совмещаю работу, учёбу и отцовские обязанности. Это нелегко, но главное — войти в темп и не терять времени зря. Для меня выкроить время оказывается проще, когда каждый час на счету.

Мне кажется, что data science сейчас — самое интересное, чем вообще можно заниматься. Универсальность подходов позволяет найти применение data science практически в любой отрасли. А значит, освоение специализации даёт не только новые карьерные возможности, но и страховку от отраслевых кризисов».

А вы готовы начать погружение в data science? Оставьте заявку на обучение и получите 30% скидки по промокоду VC-2020 (предложение действует до 31.03.2020). Узнайте больше о возможностях.

11
2 комментария

и получите 30% скидки по промокоду VC-2020чуть не прочитал COVID-2019 - хороший промокод и обучения интересные 

3
Ответить

записался пару недель назад на курс математика + машинное обучение. Жду начала курса, очень интересна эта тематика

1
Ответить