Как применять в скоринге продвинутый подход к оценке риска: кейс платформы Smally и компании Raisk

Инвестиционная платформа Smally специализируется на предоставлении займов поставщикам на рынке госзакупок в сегменте микро- и малого бизнеса. Специфика клиентов платформы в том, что это активно растущие компании с нестабильным бизнесом, работающие в сфере с высоким риском неисполнения контракта. Поэтому, определяя вероятность выхода таких заемщиков в просрочку, сложно ориентироваться на исторические данные.

Чаще всего на таких платформах используется коэффициентный анализ.

Методы коэффициентного анализа описаны в книге Владимира Козлова «Хардкорный риск-менеджмент в картинках».

Внутренней экспертизой для создания скоринга компания Smally не обладала. Для разработки системы, учитывающей особенности клиентской базы, было принято решение привлечь компанию Raisk.

Для решения поставленной задачи был применен банковский продвинутый подход к управлению кредитным риском – IRB-подход. В этой статье мы расскажем, как была построена модель и каких результатов позволила достичь.

Как строилась модель

Теоретическая база

1. Общие принципы и требования к IRB-моделям вероятности дефолта, изложенные в документе Базельского комитета по банковскому надзору “Studies on the Validation of Internal Rating Systems” (Working Paper No. 14).

2. Принципы оценки вероятности дефолта, описанные в документе Европейской службы банковского надзора (EBA) “Guidelines on PD estimation, LGD estimation and treatment defaulted exposures” (EBA/GL/2017/16).

Одновременно учитывались особенности клиентского сегмента, качество исходных данных и характер продукта компании Smally.

Суть модели

Рейтинговая система построена на модели логистической регрессии в среде Python 3.8. В основе модели – биномиальное распределение.

Модель определяет вероятность принадлежности того или иного наблюдения к бинарному таргету «NPL0+». Для этого используются данные, нормализуемые через стандартизированный WoE-биннинг. Рассчитанные вероятности переводятся в скоринговый балл с помощью мастер-шкалы. Мастер-шкала укрупнена для инвесторов компании.

Особенности подобранных признаков

1. Обладают WoE-монотонностью.

2. Соответствуют экономической логике переменной, в том числе согласно тренду Default Rate (DR).

3. Содержат минимально необходимое количество наблюдений в каждом бине (более 5%).

4. Не пересекаются по DR-тренду на 80-м доверительном интервале Уилсона*.

5. Не коррелируют с отобранными признаками (с коэффициентом корреляции Пирсона).

6. Улучшают Gini всего классификатора не менее чем на 1 п.п.

7. Имеют достаточное p-значение (меньше 0.1) в собранном классификаторе.

8. Имеют VIF (коэффициент инфляции дисперсии) менее 4.

* Wilson E.B. Probable inference, the law of succession, and statistical inference // Journal of the American Statistical Association, 1927, 22: 209–12.

Отбор признаков

Для отбора были обработаны более 500 признаков, их комбинации, группировки, кодирование, исключая one-hot-encoding (преобразование категориальных переменных в числовые).

В качестве метода однофакторного анализа выбран однофакторный отсев по Gini, меньшему 0.1, и корреляции, большей 0.5, по таргету, полученному следующей процедурой расчета:

1. Если известны фактическая и плановая даты погашения займа, таргетом = 1 является разница указанных дат при условии, что она строго больше 0.

2. Если одна из дат неизвестна, таргетом = 1 является установка статуса «Просрочен», «Просрочка», «Реструктуризация» в поле «Статус займа».

Пример отсева переменных

Сокращенный список переменных был трансформирован в категориальные WoE-интервалы, WoE-признаки – стандартизированы с помощью функции Scaler.

Пример WoE-замены и стандартизации окончательно отобранных переменных

Затем был проведен многофакторный анализ, отобранным переменным присвоены коэффициенты и веса. Gini получившегося классификатора – более 0.62.

Эксплуатация модели

К началу разработки скоринга компания выдала всего несколько сотен займов нескольким десяткам заемщиков. Сейчас через платформу прошло уже порядка 300 заемщиков, выдано более 2500 займов, и охват продолжает расти.

По результатам применения модели уровень просрочки снизился в 4 раза год-к-году (2022/2021), в 2023 г. просрочек не зафиксировано вообще.

Что же касается соблюдения регуляторных требований, то ЦБ пока еще не создал какую-либо стандартизированную систему мониторинга и учета рисков в сфере инвестиционных платформ, но все к этому идет. В любом случае наличие профессиональной модели и ее описание дают инвестиционной платформе значительное преимущество, в том числе и в общении с ЦБ в настоящее время.

Особенность этого кейса не только в том, что был применен IRB-подход, но и в том, что решение компании Raisk безболезненно встроилось в сервис платформы. Созданный микросервис был представлен клиенту как готовое решение в Docker-контейнере с CI-CD (непрерывной интеграцией и доставкой). То есть продвинутые подходы к управлению рисками соединились в этом проекте с высокотехнологичными IT-подходами, которые редко применяют «классические» моделисты и риск-менеджеры.

Будем рады услышать несколько слов о скоринге в вашей компании. Респондентам дарим книгу Владимира Козлова «Хардкорный риск-менеджмент в картинках».

0
Комментарии
-3 комментариев
Раскрывать всегда