Кейс о том, как автоматизировать рутину и обрабатывать паспорта с помощью ИИ

Всем привет!

Не секрет, что в эпоху цифровой трансформации скорость и удобство предоставления услуг становятся одним из главных конкурентных преимуществ для финансовых организаций. Именно поэтому мы наблюдаем настоящий «бум» интереса к технологиям на основе искусственного интеллекта (ИИ). В первую очередь их начинают применять для автоматизации процесса взаимодействия с клиентами и обработки большого объема типовой информации. «Нет» ручному вводу и «да» - сервисам на основе AI.

С этим лозунгом я и моя команда "Биорг" (www.beorg.ru) подошли к разработке сервиса, призванного снять с работников банков и финансовых организаций рутину, связанную с вводом персональных данных клиентов, c внесения которых и начинается клиентское обслуживание. И здесь мы расскажем о своем первом кейсе с брокерской компанией, которая согласилась внедрить наш сервис по распознаванию паспортов. Возможно, вы возьмете на вооружение этот подход, если ваша бизнес-модель предполагает большой поток входящих обращений с подтверждающими документами.

Большой пул активных клиентов, «умный» портфель ценных бумаг на основе ИИ, множество ежедневных регистраций через сайт с предоставлением скан-образов документов, удостоверяющих личность. Но их могло бы быть больше - значительная часть потенциальных клиентов уходила с сайта в течение 2,5 минут, не дождавшись обработки документов штатными операторами.

При таком масштабе работ компания-брокер решила попробовать воспользоваться нашим цифровым сервисом распознавания паспортов. Почему именно к нам и что нового в нашем продукте? Ведь на первый взгляд подобных предложений на рынке масса, включая хорошо известные OCR-программы.

А дьявол кроется в деталях - сегодня нет 100% распознавания документов, которое бы исключало потребность в ручной правке на стороне заказчика. Если уж автоматизировать, то до конца! И мы это сделали. Рассказываем, как.

Итак, заполненная клиентом заявка с фото страниц паспорта, благодаря нашему сервису на основе Saas, может сразу же отдаваться на распознавание ИИ. Т.е. вместе со сканом паспорта она уже не лежит "мертвым" грузом в почте и не ждет своей очереди, когда сотрудник финансовой компании найдет время вбить данные в систему и "заведет" клиента, чтобы тот наконец смог воспользоваться сервисами портала.

Она поступает по защищенному каналу «в облако», и ее берут «на вооружение» нейросети, которые мы научили распознавать до 96% данных любого скан-образа – в плохом качестве, с рукописным текстом, печатями и т.д. Что же тут нового? Во-первых, это очень высокий показатель, тем более, что здесь не требуется каких-либо манипуляций со стороны персонала для запуска процесса распознавания (чем грешат OCR). Во-вторых, оставшиеся 4% ( это и есть неразборчивые рукописные поля) тут же верифицируются операторами краудсорсингового сервиса, который специально «заточен» на такого рода задачи. В общем-то, отдавать поля, заполненные от руки, операторам краудсорсинговой платформы можно сразу же, не дожидаясь полного распознавания документов. Это реальный пример синергии ИИ и человека.

В конце статьи вы сможете посмотреть, как выглядят скан-образ страницы паспорта с нераспознанным полем, которое требует верификации и отдельное поле, которое заполняется оператором краудсорсинговой платформы после проверки и уточнения отчества.

Конечно же, у вас может возникнуть вопрос о защите персональных данных. И здесь клиент, в зависимости от своих пожеланий, может воспользоваться программой «нарезки» паспортных данных на отдельные поля и передавать их для оцифровки в разрозненном виде. А может пойти «классическим» путем и передавать на обработку документ целиком. Все гарантии безопасности предусмотрены и при таком сценарии.

Что же дает такой подход нашему брокеру и почему такая организация процесса может быть интересно именно вам, если речь идет о большом количестве типовых документов? Безусловно, существенно упрощается процедура регистрации новых клиентов, повышается качество данных до 100%, так как риск ошибок из-за пресловутого «человеческого фактора» полностью исключается. Бонусом к этому идет проверка подлинности и комплектности документов, что ограждает пользователей и владельцев сайта от мошеннических действий.

С точки зрения бизнес-процессов повышается скорость (по оценкам заказчика, в 3-4 раза) и качество обслуживания клиентов, данные автоматически поступают в CRM и используются в работе, а расходы на персонал сокращаются на 30%. И независимо от того, cколько обращений поступит одновременно, все они также одновременно будут запущены на распознавание и уже в течение первых двух минут посетитель сайта будет зарегистрирован. ИИ позволяет обрабатывать любые объемы информации и в любое время суток без перерыва на отдых и выходные.

Не бойтесь доверять типовые задачи искусственному интеллекту!

Кейс о том, как автоматизировать рутину и обрабатывать паспорта с помощью ИИ
Кейс о том, как автоматизировать рутину и обрабатывать паспорта с помощью ИИ
11
6 комментариев

Технологии распознавания паспорта (документов) существуют много лет, многие компании это используют. Может, в опенсорс наработки выложите?) А то больше на очерк похоже, чем на проект в трибуне.

1
Ответить

В действительности, весь код не имеет ценности. Ценность имеют только нейронные сети, их архитектуры и веса, обученные на персональных данных. Выкладывать сети, архитектуру и веса - которые у нас уникальные на наших датасетах, не готовы, ибо это наше конкурентное преимущество.

1
Ответить

Есть, например, вроде бы аналогичное решение от ABBY, которое, как я понимаю, даже не требует передачи данных на их сервера: программа устанавливается непосредственно на компы в организации и делает все что нужно https://www.abbyy.com/ru/passportreader-sdk/tech-specs/. Не совсем понятно какие ручные правки требуются у OCR-решений? Наверняка все зависит от API решения, и точно так же можно поставить распознавание на поток (т.е. после загрузки фото паспорта сразу стартует распознавание)

Ответить

Рукописный текст не распознается. Требуется закупка ПО, от персонала требуется работа со сканирующим устройством, потом корректировка нераспознанных фрагментов. У нас принципиально другой подход.

Ответить

Снизить участие оператора можно только осуществив проверку действительности распознанных данных в соответствующих официальных источниках. Во всех остальных случаях участие оператора необходимо, собственно даже как и с проверкой по базе. 

Ответить