Как использовать искусственный интеллект для автоматизации работы с документами и каких результатов ждать в итоге
Что такое OCR, почему процент автоматизации документооборота довольно низкий, и что мы в компании Dbrain узнали в процессе разработки собственного решения
Сегодня искусственный интеллект охватывает все больше и больше сфер — проверяет готовность пиццы, разыскивает преступников и анализирует происхождение Большого взрыва. В этой статье мы решили поговорить о куда более повседневном кейсе: как автоматизировать работу с документами, уменьшив время их обработки до нескольких секунд, и почему, если этого не сделать, может остановиться рост почти любой компании.
Что такое OCR?
С увеличением документооборота — бесконечных оформлений, договоров, заполнений, перезаполнений и форм — растут издержки на бэк-офис. Отдел, в свою очередь, не только требует руководства, но и влетает в копеечку: держать большой штат и грамотно им управлять — сложно и дорого. Давайте поймем, почему автоматизация здесь просто обязательна.
Представим ситуацию: вы хотите взять кредит. Ваш паспорт быстро сканируют, данные автоматически проверяются, и через пару минут одобряют заявку. Это становится возможным благодаря тому, что мы убираем необходимость выполнять рутинные действия сотрудника — ручное внесение данных из документа в систему. Именно по такому принципу работает OCR (Optical Character Recognition), технология оптического распознавания символов. Она находит изображение, за секунду разбивает его на отдельные поля, извлекает необходимые данные и автоматически заносит их в нужные формы, договоры, CRM, заявки. Ручная работа минимизируется; любые процессы, связанные с обработкой документов, ускоряются в разы.
В результате технология оптимизирует бумажную работу и, как следствие, может сократить издержки на бэк-офис вплоть до полного закрытия штата, а заодно повысить у операторов удовлетворенность работой — теперь они смогут уделять клиентам больше времени.
Кейсы применения
В повседневной жизни OCR применяется в самых разных случаях. Вот некоторые из них:
- автоматическое чтение банковских карт;
- моментальное распознавание паспорта;
- автозаполнение данных счета для оплаты в личном кабинете;
- быстрое внесение данных в договор;
сверка данных о клиенте из разных источников;
автозаполнение CRM;
- и многое другое. Чуть позже мы вернемся к этому.
А теперь давайте поговорим о минусах технологии.
Точность распознавания текста
Первая вариация OCR была изобретена еще в 1950 году в США. Сегодня она представлена разными игроками на рынке, но в процессе собственной разработки и тестирования идеи мы поняли, что существующие решения работают далеко не во всех случаях. И вот почему.
Сейчас качество распознавания полей в условном паспорте не превышает 85%. Алгоритм не умеет работать без ошибок, когда речь идет о заломах, засветах или фотографиях, сделанных на телефон. Все эти факторы сильно влияют на качество и мешают системе распознавать текст правильно. Чтобы повысить точность и помочь клиентам, мы внедрили в технологию две новые функции.
- Анализ контекста. Полученный текстовый результат дополнительно прогоняется через нейронную сеть, которая обучена учитывать контекст и автоматически исправлять ошибки. Это очень похоже на то, как Google поправляет опечатки в поиске.
- Концепция human-in-the-loop. Текст, извлеченный системой, в реальном времени передается на ручную проверку квалифицированным разметчикам данных, подключенным к нашей платформе. Они дополняют работу нейросети, исключая возможные ошибки. Комбинация работы алгоритма и человека повышает точность распознавания с 85% до 99% во всех текстах, включая рукописные. Отдельный бонус ручной верификации — она решает проблемы рукописного текста, обучает алгоритм самостоятельно находить и исправлять ошибки, и со временем качество распознавания растет, а расходы остаются на том же уровне.
Безопасность данных
Поскольку мы работаем с концепцией human-in-the-loop и распознавание происходит на наших серверах, встает вопрос о передаче данных и правильном хранении. Как гарантировать безопасность клиентам? Мы используем систему анонимизации, избегая хранения данных на своих серверах. Все это также можно делать, используя сервера и собственный персонал клиента.
Пример для наглядности. Алгоритм размывает изображение и разбивает паспорт на несколько полей на стороне клиента. Информация попадает к нам на сервера в анонимизированном виде: определить, какое поле относится к конкретному человеку, невозможно. Поля распознаются отдельно друг от друга и передаются обратно клиенту с помощью шифрования по протоколу HTTPS. Процесс занимает меньше секунды.
Подключить технологию можно через REST API — то есть очень просто. Этот интерфейс взаимодействия поддерживают почти все системы.
Выводы
С помощью OCR можно сократить или полностью избежать издержек на бэк-офис и ускорить работу всей организации. Даже при работе искусственного интеллекта с персональными данными за результат можно не бояться: существуют решения, гарантирующие полную безопасность и качество распознавания текста до 99%. Технология применима во множестве повседневных кейсов, о которых мы подробно расскажем в следующей статье.
Dbrain — платформа для создания искусственного интеллекта. Мы оптимизируем бизнес-процессы с помощью машинного обучения и работаем с компаниями самых разных направленностей. Связаться с нами можно по ссылке.
Вряд ли вы расскажете, что "под капотом" у вашей системы, но что она представляет собой внешне? Веб-морду для сервера? Десктопное приложение? В каком формате туда нужно загружать данные, какие из готовых решений применялись?
Вы же не пресс-релиз в районную газету прислали, вы сделали публикацию на ресурсе, где технарей достаточно много.
Не пойму зачем ты свои недомысли приписываешь посторонним людям, потом возбуждаешься, а потом плохо спишь. Когда тебя выпрут с работы и ты будешь околевать под мостом - будет поздно, подумай сейчас и вернись к позитиву и РЕАЛЬНЫМ отношениям, а не суррогатным в сети.
Это тебе даже "отец" интернета подтвердит, сейчас многие прозрели даже он.
Мы с радостью поделимся подробностями. Наше решение – это набор микросервисов, часть которых клиент ставит у себя, а часть остается у нас в облаке. По сети передаются анонимизированные данные, конечное взаимодействие клиента с сервисом осуществляется через API.
Да конечно, пишите на почту [email protected] все расскажем и покажем.)
Это, ребята, классический пример того, как не надо вести коммуникацию с аудиторией.
Ты у нас сегодня грибов поел?
Расскажи как надо, я сделаю кофе и вчитаюсь до самого утра.
А?
Эм... ABBYY FlexiCapture? https://www.abbyy.com/ru-ru/flexicapture/
В целом в статье мы говорим, что технология не новая, и на рынке существуют хорошие решения. Фокус нашего продукта в том, что мы совмещаем алгоритм распознавания с ручной проверкой людьми на нашей платформе.
Интересно. А сколько стоит?
Добрый день, можно написать на почту нашему сотруднику,
он подробно расскажет [email protected]
Из контрактов сможете извлекатать участников сделки, условия оплаты, нормы права, даты и т.д.?
Можем, существующий алгоритм работает с типовыми документами, так же может быть обучение на анкетах и других документах клиента.
Удивились немного про фото)).... Распознавание паспорта на фотографиях и в видеопотоке на телефоне. Работает в Тинькоффе, Почта Банке, АльфаСтраховании и ...
Конечно, можно работать с изображениями, снятыми телефоном, но точность все еще не 99%, поэтому мы подключаем к процессу краудворкинг и дообучаем алгоритм в процессе работы.
https://vc.ru/legal/56623-instrukciya-registriruemsya-v-kachestve-samozanyatogo