Райффайзенбанк

Дата-сайентисты и где они обитают: как Райффайзенбанк работает с большими данными

Почему дата-сайентисты в банке работают в разных отделах, какие задачи решают и зачем компании понадобилось Data Science комьюнити.

В конце сентября состоится онлайн-хакатон Raifhack DS, где аналитики данных разработают алгоритмы, которые будут оценивать стоимость недвижимости. Какие ещё задачи специалисты по DS помогают решать банку, рассказывает лидер DS-сообщества.

Даниил Дранга
Data Science Community Lead, Райффайзенбанк

Я начал карьеру в Data Science со стажировки: попал на нее, когда выиграл всероссийский кейс-чемпионат на втором курсе бакалавриата. Уже пятый год я работаю в Райффайзенбанке. Начинал в платформенной команде, создавал MVP-решения, потом перешел в продуктовую команду и помогал развивать DS-продукты для улучшения пользовательского опыта. С самого начала я активно участвовал в развитии нашего сообщества, сейчас продолжаю заниматься этим уже в роли лида Data Science комьюнити.

Дата-сайентисты: аналитики или инженеры?

Data Science — это область знаний на стыке аналитики, прикладной математики, программирования и обработки данных. Дата-сайентисты умеют преобразовывать большие массивы данных и применять их для решения конкретных задач: поэтому их так ценят в бизнесе.

В самом широком смысле дата-сайентист — это человек, который трансформирует бизнес с помощью машинного обучения. Он анализирует данные, разбирается в бизнес-контексте и генерирует гипотезы по улучшению продуктов. Это сближает его с аналитиками данных и продуктовыми аналитиками. Но кроме гипотез, дата-сайентист разрабатывает модели для решения конкретных задач: пишет программный код, который делает возможным создание, обучение и применение таких моделей непосредственно в процессах и продуктах.

Направления работы дата-сайентиста могут быть очень разнообразным. Вот лишь несколько из проектов, над которыми мы работаем:

  • Разработка алгоритмов для оценки стоимости залоговой недвижимости;
  • Автоматизация выявления мошеннических операций;
  • Разработка чат-бота для подсказок операторам контакт-центра;
  • Автоматическая классификация жалоб и обращений клиентов;
  • Определение оптимальных точек для размещения банкоматов;
  • Автоматическое распознавание сканов и перевод их в структурированный цифровой формат;
  • Подбор оптимального портфеля из паевых инвестиционных фондов под управлением «Райффайзен Капитал», исходя из продуктового профилирования клиента.

Я занимаюсь Data Science и продвинутой аналитикой в корпоративном блоке. За время работы в банке успел позаниматься самыми разными задачами: от глубокой продуктовой аналитики и построения моделей LTV до реализации полноценного решения автоматического распознавания неструктурированных документов.

Булат Усеинов
Data Scientist, Райффайзенбанк

Очевидно, что для работы с каждым кейсом нужны специальные знания и технологии. Поэтому на всех этапах работы дата-сайентисты взаимодействуют с другими специалистами:

  • Бизнес-эксперты помогают погрузиться в бизнес-контекст и понять доменную область;
  • Продакт-оунеры определяют вместе с дата-сайентистом сценарии использования моделей и критерии качества;
  • Аналитики предоставляют информацию о данных и метриках;
  • Дата-инженеры регулярно собирают данные и настраивают процессы по их объединению и проверке качества, а также обеспечивают к ним быстрый и удобный доступ;
  • Разработчики и DevOps-инженеры помогают реализовать решение в продакшене.

Какие типы задач мы решаем

Недавно лидеры нашего Data Science комьюнити провели исследование: они проанализировали около 6 тыс. рабочих часов и посчитали, сколько времени уделяют тем или иным задачам. Им было важно проверить, что у дата-сайентистов остается время на новые гипотезы и задачи и выяснить, нуждается ли команда в новых специалистах. Вот такие результаты получились для одной из платформенных команд, которая работает над решениями для разных продуктов:

А вот примеры задач из разных сегментов:

  • Research: изучить state-of-the-art подходы к применению активного обучения в диалоговых системах: выяснить, какие данные необходимо разметить для чат-бота, чтобы максимально повысить его качество при ограниченном количестве размечающих людей;
  • Productionalize: «обернуть» модель машинного обучения в веб-сервис Fast API: разработать небольшое веб-приложение, в которое можно вносить нужные данные и получать ответы от модели;
  • Modeling: подобрать и разработать архитектуру нейронной сети, которая будет классифицировать текстовые обращения клиентов и выделять из них именованные сущности;
  • Data Preparation & Data Understanding: изучить имеющиеся данные по снятиям и пополнениям в банкоматах сети и историю операций инкассаторов; реализовать загрузку и предобработку необходимых данных;
  • Refactoring: улучшить написанный код в продукте, уменьшить технический долг;

  • Business Understanding & Customer Communications: разработать сценарии для модели-суфлера, который «подсказывает» ответы операторам в контакт-центре. Обсудить риски, продуктовые метрики и экономическую целесообразность проекта;

  • Model Support: проанализировать работу и внести необходимые изменения в модель, находящуюся на поддержке у команды. Например, скорректировать алгоритм по снятию наличных денег в банкоматах после введения локдауна и массового перехода на удаленку.

В Райфе я занимаюсь разработкой DS-решений в рисках. Задачи дата-сайентиста развивают внимательность к деталям и способность аргументировать решения. А главное, ты можешь увидеть результат своей работы на реальных цифрах: напрямую влиять на бизнес. Есть и неочевидные плюсы: модель, например, проходит несколько уровней проверки — и проходя их вместе с ней, ты заметно развиваешь мастерство публичных выступлений.

Игорь Вахламов
Lead Data Scientist, Райффайзенбанк

Почему у нас нет отдела дата-сайенс

Организовать работу специалистов по DS в крупной компании можно двумя способами: собрать их в самостоятельный отдел (дирекцию, департамент) или распределить в продуктовые и платформенные команды внутри компании. Мы, например, начинали с первого подхода, но по мере роста команды и количества задач плавно перешли к децентрализации. Сегодня наши дата-сайентисты работают непосредственно в бизнес-доменах вместе с продакт-оунерами, разработчиками, дата-инженерами и другими специалистами.

Основные преимущества децентрализованного подхода:

  • Ориентация на конкретные цели продукта/домена. Результат работы легко оценить с помощью бизнесовых и продуктовых метрик компании. Модели не создаются ради моделей (нет «работы в стол») и их больше не нужно «продавать» бизнесу.
  • Гибкость и эффективность коммуникаций. Для создания качественных DS-продуктов необходимо участие людей с разными компетенциями. И плоские кросс-функциональные команды максимально упрощают и ускоряют взаимодействие специалистов.
  • Погруженность в доменную область. Основное отличие «плохих» моделей от «хороших» и главная причина низкого процента успешно внедренных DS-решений в индустрии — это недостаточная погруженность в экспертную область. Без понимания работы сотрудников контакт-центра, банковских продуктов и операций невозможно создать хорошего чат-бота, а без знания мошеннических схем сложно разрабатывать алгоритмы для борьбы с мошенниками.

Выбирая децентрализованную оргструктуру, мы понимали, что столкнемся с рисками:

  • Специалисты работают в разных направлениях, рано или поздно начинается рассинхрон: появляются отличия в критериях найма и в возможностях карьерного роста.
  • Дата-сайентистам в разных командах сложнее обмениваться опытом, технологиями и новостями, обсуждать задачи и подходы. Особенно это актуально для специалистов в маленьких командах.
  • Если хочется начать работать в другой доменной области, необходимо менять команду — внутренние переходы становятся сложнее.
  • Необходимо, чтобы кто-то осуществлял консалтинг по DS для команд, где нет своих дата-сайентистов, а также помогал нанимать первых лидов/сеньоров в команду.

Чтобы митигировать эти риски, мы создали DS Community: сообщество, которое помогает нам оставаться автономными, но при этом быть на связи, расти и решать разные задачи бизнеса вместе.

Когда я пришел в Райф, наша команда специализировалась на проверке гипотез для разных подразделений, которым не хватало собственной экспертизы в DS. Было круто постоянно знакомиться с новыми бизнес-процессами и искать решения по оптимизации. Дефицит DS-экспертизы в бизнес-юнитах быстро сокращался, и после удачного проекта в области OCR мы вместе с командой решили сфокусироваться на автоматическом распознавании документов — ниша оказалась «горячей», наши модели моментально улетают в прод. В целом, в Data Science мне больше всего нравится находить нестандартные решения — ведь для методов «из коробки» есть AutoML:)

Дмитрий Жванский
Senior Data Scientist, Райффайзенбанк

Сила комьюнити

Сегодня в комьюнити входят больше 50 дата-сайентистов. Все они участвуют в развитии ключевых направлений в банке: сервисов для физических лиц и корпоративных клиентов, торговли на рынках капиталов, управления рисками, казначейства, аудита и комплаенс.

Оставаться на связи, помогать друг другу и расти нам помогают разные активности и ивенты:

  • На bi-weekly (это общая встреча дата-сайентистов раз в 2 недели) мы обмениваемся опытом по использованию инструментов и обсуждаем новые кейсы.
  • Организуем общие встречи с другими странами присутствия Группы Райффайзен: например, когда в российской команде стартовала разработка чат-ботов, мы советовались с коллегами из Австрии. Они в это время работали над собственным решением и приезжали обменяться опытом.
  • Проводим брифинги, технические интервью соискателей и онбординг новых дата-сайентистов.
  • Предлагаем для всех команд единые правила найма (стандартное техническое интервью) и систему оценки скилов для решения вопроса о повышении.
  • Проводим централизованное обучение на актуальные темы: например, продвинутые методы A/B-тестирования, поддержание моделей ML в проде и инструменты для распределенного ML.
  • Раз в год проводим соревнование между всеми командами банка. До пандемии выезжали на природу — сейчас временно переместились в онлайн.
  • Мы взаимодействуем со смежными сообществами: с дата-инженерами, Python Community. Например, проводим совместное код-ревью.
  • Предоставляем DS-экспертизу для команд, в которых нет своих дата-сайентистов.
  • Помогаем перейти в Data Science сотрудникам из других направлений и, наоборот, дата-сайентистам выйти при желании на другие должности в компании.
  • Организуем открытые соревнования и хакатоны. В сентябре, например, мы проведем Raifhack DS: предложим участникам разработать алгоритм оценки стоимости коммерческой недвижимости.

Больше о Data Science комьюнити мы рассказывали в нашем блоге на Хабре: почитать, как живут и чем дышат дата-сайентисты Райфа, можно здесь.

0
27 комментариев
Популярные
По порядку
Написать комментарий...

Это все наверное очень современно.... Но вот просто сменить номер телефона и прописку для дебетовой карты Райфайзен... Это что-то с чем-то

6

а еще у них в веб версии кабинета, при пополнении вклада, в поле счет списания 
больше недели отображался какой-то SVG файл.
Может просто нанять норм программистов?

2

А можете, пожалуйста, прислать в личку скрин? Будем разбираться. 

0

Да уже пофиксили, я писал 30 августа, и пофиксили через недели 1.5, я думал в выхи будет релиз, но нет :) И когда заафекчено было тоже, хз.

Мемасиков себе там наклейте на стены ) ред.

0

Поняли, будем стараться быстрее. 
За мемы спасибо, хорошие получились.

0

Это было бы сильно легко, тут нужно вот как в статье закрутить, было очень интересно, жаль только непонятно. А так всё понравилось!

0

Катерина, здравствуйте! Сменить прописку можно прямо в приложении Райффайзен Онлайн. Что касается смены мобильного номера, то если есть доступ к старому, можно также поменять в приложении. Если же доступа нет, то провести идентификацию поможет транзакция в банкомате (например, проверка баланса) и на горячей линии поменяем на новый номер :)

–1

Вот, вот. Примерно также и отвечали в чате. Только хрен там, не менялся номер...
До сих пор плююсь, вспоминая ваш банк и ваших спецов.

1

А вот и нет! В моем городе (460 т) население, отделения вашего банка нет совсем, но зато есть 1 банкомат. Ехать до него чертикуда вобще не охота. Вобще узнала про старый номер телефона случайно, когда приложение попробовала установить, при задаче пинкода как раз на старый номер уходят смс и я их не вижу. Но! Когда с компа просто перевожу на карту другого банка - приходят СМС на новый номер. И прописка и новый номер у меня уже 5 лет. Интересно, что зарплатную карту получила в марте этого года, а прописка и номер почему-то остались ещё те, ооочень старые

1

Крутой лендинг. Спасибо за статью, интересно :)

6

Рады, что понравилось :)

1

Вы спам смс можете перестать присылать?

2

Что вы имеете в виду? 

–1

Вам какое слово непонятно?

1

Что вы имеете в виду под словом «спам»?

–1

Я имют в виду спам смс. Вы робот или вам 2 года? Вы реально не знаете, что ваш банк спамит смс, хотя я годы!!! назад ходил в отделение , закрыл счета и специально писал просьбу выключить нахрен ваш спам.

1

Дмитрий, если речь идет про рассылку рекламных предложений, пожалуйста, напишите нам в личные сообщения ваши ФИО и дату рождения, отключим. 

–1

Я про спам, называйте вещи своими именами. У вас на сайте есть способ связаться и отключить? Доступный всем?

1

Вы конечно круты, в написании подобных статей. Но вам уже написали ниже. Элементарная смена телефонного номера в личном кабинете превратилась в полугодовую пытку. Не мог этого сделать в течение полугода, не сам, на сайте, в личном кабинете, ни через общение в чате с вашими "специалистами". Вы бы лучше наняли пряморуких программеров. А статейки бомбезные писать... Ну что ж. Тоже ремесло. Никак не помогающее жить вашим многострадальным клиентам. Пришлось отказаться от услуг вашего банка.

2

Александр, здравствуйте. Сожалеем, что вы столкнулись с такой ситуацией. Как мы и писали ранее, поменять номер телефона можно в приложении, если есть доступ к старому номеру, или через транзакцию в банкомате, чтобы идентифицировать клиента и поменять номер на горячей линии. Вы можете написать нам в личку ваши ФИО и дату рождения, обязательно проверим переписку в чате. 

–1

Да мне уже пох. Как я писал ранее давно уже отказался от ваших услуг. Просто на глаза попался. До сих пор не могу отойти от тупости вашего сервиса. Уже два года прошло, а как вчера...

1

Теперь имею представление о работе дата-сайентиста 👍 интересно и доступно

2

Спасибо! Рады, что оказалось полезно :)

0

Все прекрасно, Райфайзен, но когда вы допилите подписание группы платёжек одной смс? Капец как неудобно.

2

Как раз развиваемся в этом направлении. Можем включить вас в тест, если у вас Android :) 

0

Интересно, спасибо )

1
Читать все 27 комментариев
МТС не удалила привязанные к номеру персональные данные владельца после перехода номера к другому человеку

Какое-то время я пользовалась телефонным номером МТС, годах в 2015-18х. Номер юзался только для мессенджеров, симку в поездке вынула и куда-то задевала, в итоге номер перешел другому человеку. На звонки номер не отвечал, абонент был не абонент. В 2019 узнавала в салоне, можно ли его выкупить, сказали - увы, уже 2х владельцев сменил. Ну нет и нет.…

Хочу кухню как у подруги: зачем в Циан сделали поиск квартир по фото

Рассказывает Юлия Зыкова, руководитель команды «Аудитория» в Циан.

Завод по производству идей. Как работают акселераторы, зачем они нужны стартапам и куда идти с идеей прямо сейчас

По данным Startup Genome, 9 из 10 стартапов терпят неудачу. Возможных причин «смерти» много: недостаточно протестированная гипотеза, неподтвержденная юнит-экономика, неверная стратегия или просто неудача в подходе к продажам.

Опыт возврата денег за обучение дизайну у Yakovlevv.com. Тварь я дрожащая или право имею?

В данной статье приведен мой личный опыт покупки данных курсов, мои оценочные суждения, а также сухие факты, в виде скриншотов и аудиозаписей из моей личной переписки с владельцем этих самых курсов, на тот момент исполняющего услуги как ИП Яковлев Виталий Борисович ( ОГРНИП: 319784700156839 ), сейчас же, работающего от лица ФОП Торб'як Тетяна…

Новый пролетариат

Очень давно один из классиков написал ёмкую по тогдашним временам фразу «пролетариату нечего терять, кроме своих цепей» Сейчас сложно понять её суть, но тогда она была понятна всем. Рабочий обладал только своими «руками» и это было единственное, чем он владел, абсолютное большинство жило от зарплаты до заплаты в арендованном жилье и не обладала…

ТОП-17 ошибок, которые съедают конверсию лендинга на завтрак
Как у меня украли 600 тысяч с карты, а «Тинькофф» нарушает федеральный закон

Спойлер: я не вводил никуда код, не переходил по ссылкам и не сообщал данные карты.

Возник по просьбе бразильских банкиров и стал любимым напитком солдат во время Второй мировой: история Nescafe Статьи редакции

В 2021 году Nescafe — крупнейшее подразделение Nestle и бренд, который оценивается больше чем в $20 млрд. По собственным данным компании, в мире каждую секунду выпивают более 5000 чашек напитка.

Дегустация Nescafe National Museum
Из науки в IT: как создать свой стартап и стать преподавателем

Как перейти в IT из другой сферы? Как разработать курс, которому нет аналогов? Как студенту получить максимум пользы от занятий? Рассказывает преподаватель OTUS Сергей Окатов, руководитель курсов «Kotlin Backend Developer» и «Kotlin Developer. Basic».

Мы сделали бот, который печатает и отправляет ваши фото маме. В 2 клика
Катя со свежими фотками для родителей

Мы запустили Kind Bot — доброго бота, которому в 2 клика можно скинуть свои фотки. Он их напечатает и отправит по почте вашей маме. Или другому близкому человеку.

Что Tele2 предлагает клиентам в «черную пятницу»

На главной распродаже года клиентов компании ждут сразу несколько интересных предложений: скидки на смартфоны, пакеты SMS и безлимитный трафик на YouTube, Яндекс.Карты, Яндекс.Навигатор.

null