Использование AI в банке — подходы, области применения, кейсы
Искусственный интеллект (AI, от англ. artificial intelligence) — одна из наиболее перспективных банковских технологий, которая обещает принести значительные дивиденды. В данной статье я расскажу о том, как подойти к вопросу использования AI в банке «с нуля» и о конкретных кейсах применения AI из своего опыта.
Я работаю в компании eKassir , мы занимаемся разработкой коробочного ПО для банков и финансовых организаций, в том числе — фронтальных приложений, решений для обработки платежей и т.д. Так как в наших продуктах и фронтальных системах клиентов есть много полезных данных, мы задумались о том, что с их помощью можно улучшать банковские продукты, используя AI.
Разберемся с понятиями: AI, Machine learning, Data Science
Искусственный интеллект (AI) — это область, посвященная созданию интеллектуальных систем, работающих и действующих как люди. Основной целью таких искусственно созданных систем является воспроизведение черт человеческого интеллекта:
- планирование
- обучение
- рассуждение
- решение проблем
- оперирование данными и их использование
- восприятие
- контроль и манипулирование объектами
- и, в меньшей степени, социальный интеллект и креативность.
Термины AI и Data Science пересекаются в области машинного обучения (ML, machine learning).
ML — это класс методов искусственного интеллекта, характерной чертой которого является не прямое решение задачи, а обучение в процессе применения решений множества сходных задач. ML — наиболее простой класс методов ИИ, которые можно применить в любой организации (в том числе и в банке) и достичь практического результата без каких-то крупных вложений.
Data Science - это наука о данных, объединяющая разные области знаний (информатику, математику и системный анализ). Сюда входят:
- методы обработки больших данных Big Data
- интеллектуальный анализ данных (Data Mining)
- статистические методы
- методы искусственного интеллекта, в том числе машинное обучение (ML)
Как работает машинное обучение (ML)?
Разберем на примере, который давно используется во многих банках — кредитный скоринг.
Бизнес цель: Улучшить качество кредитного портфеля.
Задача: Реализовать алгоритм оценки кредитоспособности входящего потока клиентов и обосновать его эффективность на кредитном комитете.
Подготовка к решению. Задачу оценки кредитоспособности клиента решим через прогнозирование вероятности дефолта по клиенту. Главное, что нам нужно, перед тем как к ней приступить — это найти данные по клиентам и случаи наступления кредитных дефолтов по ним же. Так как это влияет на качество предсказания, очень важно собрать максимально доступный набор параметров клиентов (например, пол, возраст, образование, ежемесячный доход, информация о посещаемых сайтах, количество фотографий в соцсетях). По найденному набору данных делаем слияние параметров с наличием просрочки по кредиту, и, исходя из этого, можем спрогнозировать по входящему клиенту и его параметрам вероятность попадания на просрочку.
Порядок решения задачи:
- Готовим Data set — собираем из разных систем максимальное количество клиентских параметров и данных по ним
- Очищаем данные и работаем с аномалиями признаков — насколько правильно у нас заполнены параметры клиентов? например, какие-то параметры могли раньше не заполняться или изменить свое значение со временем
- Переводим параметры клиентов в значимые: текст — к списку, непрерывные значения — к сегментам (возраст, например, к группам)
- Добавляем к параметрам целевую переменную: в нашем примере — бинарную (дефолтный клиент или нет)
- Обучаем разные виды моделей
- Сравниваем качество предсказания у разных моделей
- Выбираем лучший вариант по качеству предсказания и интерпретируемости
- Внедряем модель в действующие бизнес процессы
- Периодично пересчитываем модель, отслеживая рыночную ситуацию.
Поговорим о данных — обычных и больших
Как связаны Big Data и машинное обучение? Для построения моделей машинного обучения требуется много и разных данных. Big Data — это обозначение данных, обладающих 5 характеристиками:
- данные больших объемов
- разнообразные
- достоверные
- ценные
- быстрорастущие
В таблице ниже показаны особенности работы с обычными и большими данными.
Большинство банков сейчас работает с обычными данными, которые хранятся в реляционных базах данных — например, данные транзакционных систем.
Примером Big Data могут быть телефонные звонки в аудио-формате — это огромное количество информации, содержащей полезные данные, но из них сложно извлечь какую-то ценную информацию. Для работы с большими данными необходима новая аппаратная платформа (с новой файловой системой и базой для хранения), эксперты для её разворачивания и специалисты в области Data Science для обработки больших объемов данных.
Основная причина неуспешных DS-проектов
Процесс работы с данными начинается от бизнесмена: он должен сформулировать проблему. Далее необходимо перевести её в область данных, собрать Data set, и только после этого имеет смысл подключать Data Scientist’а к алгоритмизации, инжинирингу фич и математическому моделированию.
После формирования модели важно проанализировать варианты её интерпретации и возможность внедрения в инфраструктуру банка.
На практике много проектов проходит этап разработки и зависает на этапе моделирования и внедрения в промышленный контур, так как не было учтено, что для успешной работы модели в пром надо подать определенный поток данных. А это может потребовать большого количества времени и ресурсов.
Как решить эту проблему?
1. Банк обучает бизнес-экспертов инструментам Data Science и методам Big data. Очень частое явление в крупнейших банках: обучать представителей бизнес направлений Data Science, программированию на Python и т.д.
2. Погрузить эксперта Data Science в предметную область. Банк ищет эксперта Data Science и учит его бизнесовому мышлению и банковскому делу. Но вопрос — захочет ли такой специалист погружаться в другую область?
3. Оптимальный вариант — привлечь внешнюю компанию, которая имеет опыт и в работе с данными, и в предметной области, и в понимании продуктовых вещей.
Но на сегодняшний день на рынке специализированных компаний для банков нет. Поэтому eKassir стремится стать экспертом в этой области и помочь банкам в решении Data Science задач.
Этапы работы с Big data «с нуля»
С чего начать, если банк всё-таки решился поработать с большими данными с нуля?
Собрали информацию о том, что необходимо сделать и с помощью каких инструментов, если вы собрались работать с Big data своими силами.
Особенно важен последний этап — модель необходимо постоянно актуализировать, пересчитывать, так как она постоянно меняется со временем. Например, если она связана с клиентами — меняется портрет клиента, меняется рыночная ситуация и т.д. Важно все эти вещи отслеживать и закладывать время на поддержку моделей в пром. контуре — пересчет и работу с ними.
Наш реальный опыт
Как конкретно мы в eKassir применяем технологии AI в своих решениях.
1. Проверка заполнения поля «Назначение платежа».
Как обычно происходит оплата у юридических лиц? Бухгалтер набивает платежку, отправляет её в банк, в банке платежка уходит на обработку, потом в ручном режиме надо проконтролировать её статус — ушла ли она в обработку или нет. Часто необходима ручная обработка платежки операционистом. Чтобы сократить время обработки и снизить нагрузку на оперблок в банке, мы разработали решение для проверки заполнения полей платежного поручения в онлайн-режиме.
Основную массу параметров платежного поручения можно проверить с помощью справочников и регуляторных выражений. А для проверки поля «Назначение платежа» (неструктурированный параметр, без четких признаков, какое назначение платежа правильное, а какое — нет) мы решили применить нейронную сеть.
Текст назначения платежа направляем в режиме реального времени по Rest API в наш сервис (обученную нейронную сеть RoBERTa), а на выходе получаем его разобранный по полям:
Теперь мы можем проверить наличие необходимых данных и сразу ответить клиенту, чего не хватает или что надо исправить. Например, если в назначении платежа написано «Оплата по договору», но нет даты договора, мы возвращаем сообщение «Добавьте дату». Сейчас этот сервис работает не хуже реального операциониста — характеристика качества Macro F1=0,965.
Также эта нейронная сеть может использоваться для финмониторинга. Если прогнать через неё все входящие и исходящие платежи, то она поймет, за что юрлицо получает/отправляет деньги и на основе простого анализа сможет сигнализировать, когда в платежах появятся какие-то аномалии, и работа юрлица вызовет подозрения.
2. Управление наличными денежными средствами в банке.
В числе прочих у нас есть решение и для терминалов и банкоматов (управляющее мультивендорное ПО «ATM Terminal»). Соответственно, у нас в системе собираются полные данные о наличности в сети — в каком банкомате в какой кассете сколько листов осталось, когда что загружалось, как быстро выдается. Владея таким Data set, мы решили сделать систему кэш-менеджмента (планирования инкассаций). На базе накопленных данных сделать предиктивную модель и сравнить с существующей на сегодня эффективностью работы сети АТМ в банке. Тут оценить эффективность довольно просто — достаточно посмотреть, сколько устройств простаивали из-за того, что их вовремя не инкассировали, или у них кончился какой-то номинал.
Дальнейшие планы по развитию решения — интегрировать с системой планирования инкассаций, работающей по аналогии с программным обеспечением для курьеров (составляющей маршрут для инкассаторов). И добавить туда предиктивные вещи:
- например, выгодна ли замена конкретного банкомата на ресайклер или нет?
- оповещения о замене каких-то деталей в устройстве, чтобы избежать выхода из строя
- оповещения о своевременном пополнении наличных (например, в зарплатных проектах, когда банкомат стоит на предприятии, и необходимо в определенный день его пополнять, чтобы не было проблем с выдачей зарплаты сотрудникам).
Заключение
В статье мы постарались разобрать основные понятия, которые необходимо знать для начала работы с технологиями AI банковским управленцам и поделились своим опытом применения этих технологий конкретно в банковской сфере. Будем рады ответить на вопросы в комментариях и обменяться опытом с коллегами (если у вас в компании есть опыт применения AI в финансах).