Райффайзенбанк

Дата-сайентисты и где они обитают: как Райффайзенбанк работает с большими данными

Почему дата-сайентисты в банке работают в разных отделах, какие задачи решают и зачем компании понадобилось Data Science комьюнити.

В конце сентября состоится онлайн-хакатон Raifhack DS, где аналитики данных разработают алгоритмы, которые будут оценивать стоимость недвижимости. Какие ещё задачи специалисты по DS помогают решать банку, рассказывает лидер DS-сообщества.

Даниил Дранга
Data Science Community Lead, Райффайзенбанк

Я начал карьеру в Data Science со стажировки: попал на нее, когда выиграл всероссийский кейс-чемпионат на втором курсе бакалавриата. Уже пятый год я работаю в Райффайзенбанке. Начинал в платформенной команде, создавал MVP-решения, потом перешел в продуктовую команду и помогал развивать DS-продукты для улучшения пользовательского опыта. С самого начала я активно участвовал в развитии нашего сообщества, сейчас продолжаю заниматься этим уже в роли лида Data Science комьюнити.

Дата-сайентисты: аналитики или инженеры?

Data Science — это область знаний на стыке аналитики, прикладной математики, программирования и обработки данных. Дата-сайентисты умеют преобразовывать большие массивы данных и применять их для решения конкретных задач: поэтому их так ценят в бизнесе.

В самом широком смысле дата-сайентист — это человек, который трансформирует бизнес с помощью машинного обучения. Он анализирует данные, разбирается в бизнес-контексте и генерирует гипотезы по улучшению продуктов. Это сближает его с аналитиками данных и продуктовыми аналитиками. Но кроме гипотез, дата-сайентист разрабатывает модели для решения конкретных задач: пишет программный код, который делает возможным создание, обучение и применение таких моделей непосредственно в процессах и продуктах.

Направления работы дата-сайентиста могут быть очень разнообразным. Вот лишь несколько из проектов, над которыми мы работаем:

  • Разработка алгоритмов для оценки стоимости залоговой недвижимости;
  • Автоматизация выявления мошеннических операций;
  • Разработка чат-бота для подсказок операторам контакт-центра;
  • Автоматическая классификация жалоб и обращений клиентов;
  • Определение оптимальных точек для размещения банкоматов;
  • Автоматическое распознавание сканов и перевод их в структурированный цифровой формат;
  • Подбор оптимального портфеля из паевых инвестиционных фондов под управлением «Райффайзен Капитал», исходя из продуктового профилирования клиента.

Я занимаюсь Data Science и продвинутой аналитикой в корпоративном блоке. За время работы в банке успел позаниматься самыми разными задачами: от глубокой продуктовой аналитики и построения моделей LTV до реализации полноценного решения автоматического распознавания неструктурированных документов.

Булат Усеинов
Data Scientist, Райффайзенбанк

Очевидно, что для работы с каждым кейсом нужны специальные знания и технологии. Поэтому на всех этапах работы дата-сайентисты взаимодействуют с другими специалистами:

  • Бизнес-эксперты помогают погрузиться в бизнес-контекст и понять доменную область;
  • Продакт-оунеры определяют вместе с дата-сайентистом сценарии использования моделей и критерии качества;
  • Аналитики предоставляют информацию о данных и метриках;
  • Дата-инженеры регулярно собирают данные и настраивают процессы по их объединению и проверке качества, а также обеспечивают к ним быстрый и удобный доступ;
  • Разработчики и DevOps-инженеры помогают реализовать решение в продакшене.

Какие типы задач мы решаем

Недавно лидеры нашего Data Science комьюнити провели исследование: они проанализировали около 6 тыс. рабочих часов и посчитали, сколько времени уделяют тем или иным задачам. Им было важно проверить, что у дата-сайентистов остается время на новые гипотезы и задачи и выяснить, нуждается ли команда в новых специалистах. Вот такие результаты получились для одной из платформенных команд, которая работает над решениями для разных продуктов:

А вот примеры задач из разных сегментов:

  • Research: изучить state-of-the-art подходы к применению активного обучения в диалоговых системах: выяснить, какие данные необходимо разметить для чат-бота, чтобы максимально повысить его качество при ограниченном количестве размечающих людей;
  • Productionalize: «обернуть» модель машинного обучения в веб-сервис Fast API: разработать небольшое веб-приложение, в которое можно вносить нужные данные и получать ответы от модели;
  • Modeling: подобрать и разработать архитектуру нейронной сети, которая будет классифицировать текстовые обращения клиентов и выделять из них именованные сущности;
  • Data Preparation & Data Understanding: изучить имеющиеся данные по снятиям и пополнениям в банкоматах сети и историю операций инкассаторов; реализовать загрузку и предобработку необходимых данных;
  • Refactoring: улучшить написанный код в продукте, уменьшить технический долг;

  • Business Understanding & Customer Communications: разработать сценарии для модели-суфлера, который «подсказывает» ответы операторам в контакт-центре. Обсудить риски, продуктовые метрики и экономическую целесообразность проекта;

  • Model Support: проанализировать работу и внести необходимые изменения в модель, находящуюся на поддержке у команды. Например, скорректировать алгоритм по снятию наличных денег в банкоматах после введения локдауна и массового перехода на удаленку.

В Райфе я занимаюсь разработкой DS-решений в рисках. Задачи дата-сайентиста развивают внимательность к деталям и способность аргументировать решения. А главное, ты можешь увидеть результат своей работы на реальных цифрах: напрямую влиять на бизнес. Есть и неочевидные плюсы: модель, например, проходит несколько уровней проверки — и проходя их вместе с ней, ты заметно развиваешь мастерство публичных выступлений.

Игорь Вахламов
Lead Data Scientist, Райффайзенбанк

Почему у нас нет отдела дата-сайенс

Организовать работу специалистов по DS в крупной компании можно двумя способами: собрать их в самостоятельный отдел (дирекцию, департамент) или распределить в продуктовые и платформенные команды внутри компании. Мы, например, начинали с первого подхода, но по мере роста команды и количества задач плавно перешли к децентрализации. Сегодня наши дата-сайентисты работают непосредственно в бизнес-доменах вместе с продакт-оунерами, разработчиками, дата-инженерами и другими специалистами.

Основные преимущества децентрализованного подхода:

  • Ориентация на конкретные цели продукта/домена. Результат работы легко оценить с помощью бизнесовых и продуктовых метрик компании. Модели не создаются ради моделей (нет «работы в стол») и их больше не нужно «продавать» бизнесу.
  • Гибкость и эффективность коммуникаций. Для создания качественных DS-продуктов необходимо участие людей с разными компетенциями. И плоские кросс-функциональные команды максимально упрощают и ускоряют взаимодействие специалистов.
  • Погруженность в доменную область. Основное отличие «плохих» моделей от «хороших» и главная причина низкого процента успешно внедренных DS-решений в индустрии — это недостаточная погруженность в экспертную область. Без понимания работы сотрудников контакт-центра, банковских продуктов и операций невозможно создать хорошего чат-бота, а без знания мошеннических схем сложно разрабатывать алгоритмы для борьбы с мошенниками.

Выбирая децентрализованную оргструктуру, мы понимали, что столкнемся с рисками:

  • Специалисты работают в разных направлениях, рано или поздно начинается рассинхрон: появляются отличия в критериях найма и в возможностях карьерного роста.
  • Дата-сайентистам в разных командах сложнее обмениваться опытом, технологиями и новостями, обсуждать задачи и подходы. Особенно это актуально для специалистов в маленьких командах.
  • Если хочется начать работать в другой доменной области, необходимо менять команду — внутренние переходы становятся сложнее.
  • Необходимо, чтобы кто-то осуществлял консалтинг по DS для команд, где нет своих дата-сайентистов, а также помогал нанимать первых лидов/сеньоров в команду.

Чтобы митигировать эти риски, мы создали DS Community: сообщество, которое помогает нам оставаться автономными, но при этом быть на связи, расти и решать разные задачи бизнеса вместе.

Когда я пришел в Райф, наша команда специализировалась на проверке гипотез для разных подразделений, которым не хватало собственной экспертизы в DS. Было круто постоянно знакомиться с новыми бизнес-процессами и искать решения по оптимизации. Дефицит DS-экспертизы в бизнес-юнитах быстро сокращался, и после удачного проекта в области OCR мы вместе с командой решили сфокусироваться на автоматическом распознавании документов — ниша оказалась «горячей», наши модели моментально улетают в прод. В целом, в Data Science мне больше всего нравится находить нестандартные решения — ведь для методов «из коробки» есть AutoML:)

Дмитрий Жванский
Senior Data Scientist, Райффайзенбанк

Сила комьюнити

Сегодня в комьюнити входят больше 50 дата-сайентистов. Все они участвуют в развитии ключевых направлений в банке: сервисов для физических лиц и корпоративных клиентов, торговли на рынках капиталов, управления рисками, казначейства, аудита и комплаенс.

Оставаться на связи, помогать друг другу и расти нам помогают разные активности и ивенты:

  • На bi-weekly (это общая встреча дата-сайентистов раз в 2 недели) мы обмениваемся опытом по использованию инструментов и обсуждаем новые кейсы.
  • Организуем общие встречи с другими странами присутствия Группы Райффайзен: например, когда в российской команде стартовала разработка чат-ботов, мы советовались с коллегами из Австрии. Они в это время работали над собственным решением и приезжали обменяться опытом.
  • Проводим брифинги, технические интервью соискателей и онбординг новых дата-сайентистов.
  • Предлагаем для всех команд единые правила найма (стандартное техническое интервью) и систему оценки скилов для решения вопроса о повышении.
  • Проводим централизованное обучение на актуальные темы: например, продвинутые методы A/B-тестирования, поддержание моделей ML в проде и инструменты для распределенного ML.
  • Раз в год проводим соревнование между всеми командами банка. До пандемии выезжали на природу — сейчас временно переместились в онлайн.
  • Мы взаимодействуем со смежными сообществами: с дата-инженерами, Python Community. Например, проводим совместное код-ревью.
  • Предоставляем DS-экспертизу для команд, в которых нет своих дата-сайентистов.
  • Помогаем перейти в Data Science сотрудникам из других направлений и, наоборот, дата-сайентистам выйти при желании на другие должности в компании.
  • Организуем открытые соревнования и хакатоны. В сентябре, например, мы проведем Raifhack DS: предложим участникам разработать алгоритм оценки стоимости коммерческой недвижимости.

Больше о Data Science комьюнити мы рассказывали в нашем блоге на Хабре: почитать, как живут и чем дышат дата-сайентисты Райфа, можно здесь.

{ "author_name": "Райффайзенбанк", "author_type": "editor", "tags": [], "comments": 27, "likes": 14, "favorites": 21, "is_advertisement": false, "subsite_label": "raiffeisenbank", "id": 289056, "is_wide": true, "is_ugc": false, "date": "Thu, 09 Sep 2021 14:51:30 +0300", "is_special": false }
0
27 комментариев
Популярные
По порядку
Написать комментарий...

Крутой лендинг. Спасибо за статью, интересно :)

6

Рады, что понравилось :)

1

Это все наверное очень современно.... Но вот просто сменить номер телефона и прописку для дебетовой карты Райфайзен... Это что-то с чем-то

6

а еще у них в веб версии кабинета, при пополнении вклада, в поле счет списания 
больше недели отображался какой-то SVG файл.
Может просто нанять норм программистов?

1

А можете, пожалуйста, прислать в личку скрин? Будем разбираться. 

0

Да уже пофиксили, я писал 30 августа, и пофиксили через недели 1.5, я думал в выхи будет релиз, но нет :) И когда заафекчено было тоже, хз.

Мемасиков себе там наклейте на стены ) ред.

0

Поняли, будем стараться быстрее. 
За мемы спасибо, хорошие получились.

0

Это было бы сильно легко, тут нужно вот как в статье закрутить, было очень интересно, жаль только непонятно. А так всё понравилось!

0

Катерина, здравствуйте! Сменить прописку можно прямо в приложении Райффайзен Онлайн. Что касается смены мобильного номера, то если есть доступ к старому, можно также поменять в приложении. Если же доступа нет, то провести идентификацию поможет транзакция в банкомате (например, проверка баланса) и на горячей линии поменяем на новый номер :)

–1

Вот, вот. Примерно также и отвечали в чате. Только хрен там, не менялся номер...
До сих пор плююсь, вспоминая ваш банк и ваших спецов.

1

А вот и нет! В моем городе (460 т) население, отделения вашего банка нет совсем, но зато есть 1 банкомат. Ехать до него чертикуда вобще не охота. Вобще узнала про старый номер телефона случайно, когда приложение попробовала установить, при задаче пинкода как раз на старый номер уходят смс и я их не вижу. Но! Когда с компа просто перевожу на карту другого банка - приходят СМС на новый номер. И прописка и новый номер у меня уже 5 лет. Интересно, что зарплатную карту получила в марте этого года, а прописка и номер почему-то остались ещё те, ооочень старые

1

Теперь имею представление о работе дата-сайентиста 👍 интересно и доступно

2

Спасибо! Рады, что оказалось полезно :)

0

Вы спам смс можете перестать присылать?

1

Что вы имеете в виду? 

0

Вам какое слово непонятно?

0

Что вы имеете в виду под словом «спам»?

0

Я имют в виду спам смс. Вы робот или вам 2 года? Вы реально не знаете, что ваш банк спамит смс, хотя я годы!!! назад ходил в отделение , закрыл счета и специально писал просьбу выключить нахрен ваш спам.

0

Дмитрий, если речь идет про рассылку рекламных предложений, пожалуйста, напишите нам в личные сообщения ваши ФИО и дату рождения, отключим. 

0

Я про спам, называйте вещи своими именами. У вас на сайте есть способ связаться и отключить? Доступный всем?

0

Все прекрасно, Райфайзен, но когда вы допилите подписание группы платёжек одной смс? Капец как неудобно.

1

Как раз развиваемся в этом направлении. Можем включить вас в тест, если у вас Android :) 

0

Интересно, спасибо )

1

Вы конечно круты, в написании подобных статей. Но вам уже написали ниже. Элементарная смена телефонного номера в личном кабинете превратилась в полугодовую пытку. Не мог этого сделать в течение полугода, не сам, на сайте, в личном кабинете, ни через общение в чате с вашими "специалистами". Вы бы лучше наняли пряморуких программеров. А статейки бомбезные писать... Ну что ж. Тоже ремесло. Никак не помогающее жить вашим многострадальным клиентам. Пришлось отказаться от услуг вашего банка.

1

Александр, здравствуйте. Сожалеем, что вы столкнулись с такой ситуацией. Как мы и писали ранее, поменять номер телефона можно в приложении, если есть доступ к старому номеру, или через транзакцию в банкомате, чтобы идентифицировать клиента и поменять номер на горячей линии. Вы можете написать нам в личку ваши ФИО и дату рождения, обязательно проверим переписку в чате. 

0

Да мне уже пох. Как я писал ранее давно уже отказался от ваших услуг. Просто на глаза попался. До сих пор не могу отойти от тупости вашего сервиса. Уже два года прошло, а как вчера...

0
Читать все 27 комментариев
Онлайн-кинотеатр IVI начал съёмки самого правдивого сериала про современный российский наркобизнес
«В магазин должны идти не за пивом, а к тебе»: предприниматель открывает пивные магазины для других Статьи редакции

Давид Аракелян начал с торговли в ларьках в 90-е, работал в игорном бизнесе, строил маршруты для вывоза мусора и торговал пивом. Сейчас он открывает для других несколько пивных магазинов в месяц и берёт за каждый 150 тысяч рублей.

Ассортимент одного из магазинов
5 заповедей для бизнеса, которым я не следую

Есть «истины» очевидные всем — «Пушкин, это лучший русский поэт». Хорошо если человек предлагает относительно безобидную альтернативу, «Больше люблю Лермонтова», а если «Ну не знаю, Немиров лучше» или «Мне вообще Пушкин не нравится». За такое и побить могут.

Стоимость акций социальной сети Дональда Трампа выросла на 275% за сутки

Бывший президент США Дональд Трамп анонсировал запуск собственной социальной сети Truth Social и сразу запустил её на биржу, где она показывает высокий рост.

С книжной полки на рынок мобильных приложений. История Laoshi.io

Продолжение истории компании Лаоши. С 2011 года мы занимаемся преподаванием китайского языка. За это время делали сеть школ китайского языка и онлайн-школу, создавали платформу для изучения китайского онлайн, издавали учебник и прописи. Сейчас разрабатываем мобильное приложение для англоязычного рынка.

Приложение для изучение китайских слов и иероглифов Laoshi.io
Участвуйте в IPO Softline Group!

С 18 октября открыта книга заявок на участие в IPO глобальной IT-корпорации Softline Group.

Как с помощью карты Censydiam создать позиционирование бренда

Бренд-стратег Nimax Оля Якушенко рассказывает о том, как использовать фреймворк при построения брендинговых и маркетинговых стратегий компании.

Карта Censydiam
Вопросы налогообложения при инвестировании. Что важно учитывать?

Инвестиции в ценные бумаги и иные финансовые инструменты в последние несколько лет пользуются популярностью не только у профессиональных игроков рынка, но и у частных инвесторов, для которых данный вид деятельности представляет собой некое хобби.

Бизнес-филантропия и благотворительность. Почему это не затраты, а вложения? Рассказываем на примере CloudPayments

Социальная ответственность составляет важную часть ДНК компании CloudPayments. Делимся инсайтами, почему мы поддерживаем НКО, создаем благотворительные проекты и как транслируем принципы филантропии внутри команды.

Cтартап по созданию NFT на спортивную тематику Candy Digital привлёк $100 млн при оценке в $1,5 млрд Статьи редакции

В октябре компания запустит платформу для торговли токенами.

NFT от Candy Digital
Цифровая трансформация банков: что это такое?
Автор: Ксения Борбачева
заместитель генерального лиректора Агентства инноваций Москвы
null