{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Использование AI в банке — подходы, области применения, кейсы

Искусственный интеллект (AI, от англ. artificial intelligence) — одна из наиболее перспективных банковских технологий, которая обещает принести значительные дивиденды. В данной статье я расскажу о том, как подойти к вопросу использования AI в банке «с нуля» и о конкретных кейсах применения AI из своего опыта.

Я работаю в компании eKassir , мы занимаемся разработкой коробочного ПО для банков и финансовых организаций, в том числе — фронтальных приложений, решений для обработки платежей и т.д. Так как в наших продуктах и фронтальных системах клиентов есть много полезных данных, мы задумались о том, что с их помощью можно улучшать банковские продукты, используя AI.

Разберемся с понятиями: AI, Machine learning, Data Science

Искусственный интеллект (AI) — это область, посвященная созданию интеллектуальных систем, работающих и действующих как люди. Основной целью таких искусственно созданных систем является воспроизведение черт человеческого интеллекта:

  • планирование
  • обучение
  • рассуждение
  • решение проблем
  • оперирование данными и их использование
  • восприятие
  • контроль и манипулирование объектами
  • и, в меньшей степени, социальный интеллект и креативность.

Термины AI и Data Science пересекаются в области машинного обучения (ML, machine learning).

ML — это класс методов искусственного интеллекта, характерной чертой которого является не прямое решение задачи, а обучение в процессе применения решений множества сходных задач. ML — наиболее простой класс методов ИИ, которые можно применить в любой организации (в том числе и в банке) и достичь практического результата без каких-то крупных вложений.

Data Science - это наука о данных, объединяющая разные области знаний (информатику, математику и системный анализ). Сюда входят:

  • методы обработки больших данных Big Data
  • интеллектуальный анализ данных (Data Mining)
  • статистические методы
  • методы искусственного интеллекта, в том числе машинное обучение (ML)

Как работает машинное обучение (ML)?

Разберем на примере, который давно используется во многих банках — кредитный скоринг.

Бизнес цель: Улучшить качество кредитного портфеля.

Задача: Реализовать алгоритм оценки кредитоспособности входящего потока клиентов и обосновать его эффективность на кредитном комитете.

Подготовка к решению. Задачу оценки кредитоспособности клиента решим через прогнозирование вероятности дефолта по клиенту. Главное, что нам нужно, перед тем как к ней приступить — это найти данные по клиентам и случаи наступления кредитных дефолтов по ним же. Так как это влияет на качество предсказания, очень важно собрать максимально доступный набор параметров клиентов (например, пол, возраст, образование, ежемесячный доход, информация о посещаемых сайтах, количество фотографий в соцсетях). По найденному набору данных делаем слияние параметров с наличием просрочки по кредиту, и, исходя из этого, можем спрогнозировать по входящему клиенту и его параметрам вероятность попадания на просрочку.

Порядок решения задачи:

  • Готовим Data set — собираем из разных систем максимальное количество клиентских параметров и данных по ним
  • Очищаем данные и работаем с аномалиями признаков — насколько правильно у нас заполнены параметры клиентов? например, какие-то параметры могли раньше не заполняться или изменить свое значение со временем
  • Переводим параметры клиентов в значимые: текст — к списку, непрерывные значения — к сегментам (возраст, например, к группам)
  • Добавляем к параметрам целевую переменную: в нашем примере — бинарную (дефолтный клиент или нет)
  • Обучаем разные виды моделей
  • Сравниваем качество предсказания у разных моделей
  • Выбираем лучший вариант по качеству предсказания и интерпретируемости
  • Внедряем модель в действующие бизнес процессы
  • Периодично пересчитываем модель, отслеживая рыночную ситуацию.

Поговорим о данных — обычных и больших

Как связаны Big Data и машинное обучение? Для построения моделей машинного обучения требуется много и разных данных. Big Data — это обозначение данных, обладающих 5 характеристиками:

  • данные больших объемов
  • разнообразные
  • достоверные
  • ценные
  • быстрорастущие

В таблице ниже показаны особенности работы с обычными и большими данными.

Большинство банков сейчас работает с обычными данными, которые хранятся в реляционных базах данных — например, данные транзакционных систем.

Примером Big Data могут быть телефонные звонки в аудио-формате — это огромное количество информации, содержащей полезные данные, но из них сложно извлечь какую-то ценную информацию. Для работы с большими данными необходима новая аппаратная платформа (с новой файловой системой и базой для хранения), эксперты для её разворачивания и специалисты в области Data Science для обработки больших объемов данных.

Основная причина неуспешных DS-проектов

Процесс работы с данными начинается от бизнесмена: он должен сформулировать проблему. Далее необходимо перевести её в область данных, собрать Data set, и только после этого имеет смысл подключать Data Scientist’а к алгоритмизации, инжинирингу фич и математическому моделированию.

После формирования модели важно проанализировать варианты её интерпретации и возможность внедрения в инфраструктуру банка.

На практике много проектов проходит этап разработки и зависает на этапе моделирования и внедрения в промышленный контур, так как не было учтено, что для успешной работы модели в пром надо подать определенный поток данных. А это может потребовать большого количества времени и ресурсов.

Как решить эту проблему?

1. Банк обучает бизнес-экспертов инструментам Data Science и методам Big data. Очень частое явление в крупнейших банках: обучать представителей бизнес направлений Data Science, программированию на Python и т.д.

2. Погрузить эксперта Data Science в предметную область. Банк ищет эксперта Data Science и учит его бизнесовому мышлению и банковскому делу. Но вопрос — захочет ли такой специалист погружаться в другую область?

3. Оптимальный вариант — привлечь внешнюю компанию, которая имеет опыт и в работе с данными, и в предметной области, и в понимании продуктовых вещей.

Но на сегодняшний день на рынке специализированных компаний для банков нет. Поэтому eKassir стремится стать экспертом в этой области и помочь банкам в решении Data Science задач.

Этапы работы с Big data «с нуля»

С чего начать, если банк всё-таки решился поработать с большими данными с нуля?

Собрали информацию о том, что необходимо сделать и с помощью каких инструментов, если вы собрались работать с Big data своими силами.

Особенно важен последний этап — модель необходимо постоянно актуализировать, пересчитывать, так как она постоянно меняется со временем. Например, если она связана с клиентами — меняется портрет клиента, меняется рыночная ситуация и т.д. Важно все эти вещи отслеживать и закладывать время на поддержку моделей в пром. контуре — пересчет и работу с ними.

Наш реальный опыт

Как конкретно мы в eKassir применяем технологии AI в своих решениях.

1. Проверка заполнения поля «Назначение платежа».

Как обычно происходит оплата у юридических лиц? Бухгалтер набивает платежку, отправляет её в банк, в банке платежка уходит на обработку, потом в ручном режиме надо проконтролировать её статус — ушла ли она в обработку или нет. Часто необходима ручная обработка платежки операционистом. Чтобы сократить время обработки и снизить нагрузку на оперблок в банке, мы разработали решение для проверки заполнения полей платежного поручения в онлайн-режиме.

Основную массу параметров платежного поручения можно проверить с помощью справочников и регуляторных выражений. А для проверки поля «Назначение платежа» (неструктурированный параметр, без четких признаков, какое назначение платежа правильное, а какое — нет) мы решили применить нейронную сеть.

Текст назначения платежа направляем в режиме реального времени по Rest API в наш сервис (обученную нейронную сеть RoBERTa), а на выходе получаем его разобранный по полям:

Теперь мы можем проверить наличие необходимых данных и сразу ответить клиенту, чего не хватает или что надо исправить. Например, если в назначении платежа написано «Оплата по договору», но нет даты договора, мы возвращаем сообщение «Добавьте дату». Сейчас этот сервис работает не хуже реального операциониста — характеристика качества Macro F1=0,965.

Также эта нейронная сеть может использоваться для финмониторинга. Если прогнать через неё все входящие и исходящие платежи, то она поймет, за что юрлицо получает/отправляет деньги и на основе простого анализа сможет сигнализировать, когда в платежах появятся какие-то аномалии, и работа юрлица вызовет подозрения.

2. Управление наличными денежными средствами в банке.

В числе прочих у нас есть решение и для терминалов и банкоматов (управляющее мультивендорное ПО «ATM Terminal»). Соответственно, у нас в системе собираются полные данные о наличности в сети — в каком банкомате в какой кассете сколько листов осталось, когда что загружалось, как быстро выдается. Владея таким Data set, мы решили сделать систему кэш-менеджмента (планирования инкассаций). На базе накопленных данных сделать предиктивную модель и сравнить с существующей на сегодня эффективностью работы сети АТМ в банке. Тут оценить эффективность довольно просто — достаточно посмотреть, сколько устройств простаивали из-за того, что их вовремя не инкассировали, или у них кончился какой-то номинал.

Дальнейшие планы по развитию решения — интегрировать с системой планирования инкассаций, работающей по аналогии с программным обеспечением для курьеров (составляющей маршрут для инкассаторов). И добавить туда предиктивные вещи:

  • например, выгодна ли замена конкретного банкомата на ресайклер или нет?
  • оповещения о замене каких-то деталей в устройстве, чтобы избежать выхода из строя
  • оповещения о своевременном пополнении наличных (например, в зарплатных проектах, когда банкомат стоит на предприятии, и необходимо в определенный день его пополнять, чтобы не было проблем с выдачей зарплаты сотрудникам).

Заключение

В статье мы постарались разобрать основные понятия, которые необходимо знать для начала работы с технологиями AI банковским управленцам и поделились своим опытом применения этих технологий конкретно в банковской сфере. Будем рады ответить на вопросы в комментариях и обменяться опытом с коллегами (если у вас в компании есть опыт применения AI в финансах).

#ai #machinelearning #fintech

0
Комментарии
-3 комментариев
Раскрывать всегда