{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Dbrain

24 янв 2019 24.01.2019

Как использовать искусственный интеллект для автоматизации работы с документами и каких результатов ждать в итоге

Что такое OCR, почему процент автоматизации документооборота довольно низкий, и что мы в компании Dbrain узнали в процессе разработки собственного решения

Сегодня искусственный интеллект охватывает все больше и больше сфер — проверяет готовность пиццы, разыскивает преступников и анализирует происхождение Большого взрыва. В этой статье мы решили поговорить о куда более повседневном кейсе: как автоматизировать работу с документами, уменьшив время их обработки до нескольких секунд, и почему, если этого не сделать, может остановиться рост почти любой компании.

Что такое OCR?

С увеличением документооборота — бесконечных оформлений, договоров, заполнений, перезаполнений и форм — растут издержки на бэк-офис. Отдел, в свою очередь, не только требует руководства, но и влетает в копеечку: держать большой штат и грамотно им управлять — сложно и дорого. Давайте поймем, почему автоматизация здесь просто обязательна.

Представим ситуацию: вы хотите взять кредит. Ваш паспорт быстро сканируют, данные автоматически проверяются, и через пару минут одобряют заявку. Это становится возможным благодаря тому, что мы убираем необходимость выполнять рутинные действия сотрудника — ручное внесение данных из документа в систему. Именно по такому принципу работает OCR (Optical Character Recognition), технология оптического распознавания символов. Она находит изображение, за секунду разбивает его на отдельные поля, извлекает необходимые данные и автоматически заносит их в нужные формы, договоры, CRM, заявки. Ручная работа минимизируется; любые процессы, связанные с обработкой документов, ускоряются в разы.

В результате технология оптимизирует бумажную работу и, как следствие, может сократить издержки на бэк-офис вплоть до полного закрытия штата, а заодно повысить у операторов удовлетворенность работой — теперь они смогут уделять клиентам больше времени.

Кейсы применения

В повседневной жизни OCR применяется в самых разных случаях. Вот некоторые из них:

автоматическое чтение банковских карт;
моментальное распознавание паспорта;
автозаполнение данных счета для оплаты в личном кабинете;
быстрое внесение данных в договор;
сверка данных о клиенте из разных источников;
автозаполнение CRM;
и многое другое. Чуть позже мы вернемся к этому.

А теперь давайте поговорим о минусах технологии.

Точность распознавания текста

Первая вариация OCR была изобретена еще в 1950 году в США. Сегодня она представлена разными игроками на рынке, но в процессе собственной разработки и тестирования идеи мы поняли, что существующие решения работают далеко не во всех случаях. И вот почему.

Сейчас качество распознавания полей в условном паспорте не превышает 85%. Алгоритм не умеет работать без ошибок, когда речь идет о заломах, засветах или фотографиях, сделанных на телефон. Все эти факторы сильно влияют на качество и мешают системе распознавать текст правильно. Чтобы повысить точность и помочь клиентам, мы внедрили в технологию две новые функции.

Анализ контекста. Полученный текстовый результат дополнительно прогоняется через нейронную сеть, которая обучена учитывать контекст и автоматически исправлять ошибки. Это очень похоже на то, как Google поправляет опечатки в поиске.
Концепция human-in-the-loop. Текст, извлеченный системой, в реальном времени передается на ручную проверку квалифицированным разметчикам данных, подключенным к нашей платформе. Они дополняют работу нейросети, исключая возможные ошибки. Комбинация работы алгоритма и человека повышает точность распознавания с 85% до 99% во всех текстах, включая рукописные. Отдельный бонус ручной верификации — она решает проблемы рукописного текста, обучает алгоритм самостоятельно находить и исправлять ошибки, и со временем качество распознавания растет, а расходы остаются на том же уровне.

Безопасность данных

Поскольку мы работаем с концепцией human-in-the-loop и распознавание происходит на наших серверах, встает вопрос о передаче данных и правильном хранении. Как гарантировать безопасность клиентам? Мы используем систему анонимизации, избегая хранения данных на своих серверах. Все это также можно делать, используя сервера и собственный персонал клиента.

Пример для наглядности. Алгоритм размывает изображение и разбивает паспорт на несколько полей на стороне клиента. Информация попадает к нам на сервера в анонимизированном виде: определить, какое поле относится к конкретному человеку, невозможно. Поля распознаются отдельно друг от друга и передаются обратно клиенту с помощью шифрования по протоколу HTTPS. Процесс занимает меньше секунды.

Подключить технологию можно через REST API — то есть очень просто. Этот интерфейс взаимодействия поддерживают почти все системы.

Выводы

С помощью OCR можно сократить или полностью избежать издержек на бэк-офис и ускорить работу всей организации. Даже при работе искусственного интеллекта с персональными данными за результат можно не бояться: существуют решения, гарантирующие полную безопасность и качество распознавания текста до 99%. Технология применима во множестве повседневных кейсов, о которых мы подробно расскажем в следующей статье.

Dbrain — платформа для создания искусственного интеллекта. Мы оптимизируем бизнес-процессы с помощью машинного обучения и работаем с компаниями самых разных направленностей. Связаться с нами можно по ссылке.

18 показов

5.2K открытий

{"id":233759,"url":"https:\/\/vc.ru\/u\/233759-dbrain","name":"Dbrain","avatar":"42fb4b42-28f1-5a4c-abde-e19f32269c9e","karma":1083,"description":"\u041c\u044b \u0441\u0435\u0440\u0432\u0438\u0441 \u0438\u0437\u0432\u043b\u0435\u0447\u0435\u043d\u0438\u044f \u0434\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u043e\u0432. \u0420\u0430\u0431\u043e\u0442\u0430\u0435\u043c \u0441 \u043f\u0430\u0441\u043f\u043e\u0440\u0442\u0430\u043c\u0438, \u0412\u0423, \u0421\u0422\u0421, \u0434\u043e\u0433\u043e\u0432\u043e\u0440\u0430\u043c\u0438 \u0438 \u043f\u0435\u0440\u0432\u0438\u0447\u043d\u043e\u0439 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0435\u0439. \u0418\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c \u0418\u0418 \u0432\u043c\u0435\u0441\u0442\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u0432\u0430\u0448\u0438\u0445 \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u043e\u0432","isMe":false,"isSubscribed":false,"isNotificationsEnabled":false,"isShowMessengerButton":false,"isShowSubscribe":true,"hasBadge":false,"badgeType":null,"badgeUuid":null,"badgeUrl":null,"hasVideoAvatar":false}

16 комментариев

Написать комментарий...

Станислав Курочкин

24.01.2019

Вряд ли вы расскажете, что "под капотом" у вашей системы, но что она представляет собой внешне? Веб-морду для сервера? Десктопное приложение? В каком формате туда нужно загружать данные, какие из готовых решений применялись?

Вы же не пресс-релиз в районную газету прислали, вы сделали публикацию на ресурсе, где технарей достаточно много.

Ответить

Развернуть ветку

Frank Wallace

24.01.2019

Не пойму зачем ты свои недомысли приписываешь посторонним людям, потом возбуждаешься, а потом плохо спишь. Когда тебя выпрут с работы и ты будешь околевать под мостом - будет поздно, подумай сейчас и вернись к позитиву и РЕАЛЬНЫМ отношениям, а не суррогатным в сети.
Это тебе даже "отец" интернета подтвердит, сейчас многие прозрели даже он.

Ответить

Развернуть ветку

Dbrain

25.01.2019 Автор

Мы с радостью поделимся подробностями. Наше решение – это набор микросервисов, часть которых клиент ставит у себя, а часть остается у нас в облаке. По сети передаются анонимизированные данные, конечное взаимодействие клиента с сервисом осуществляется через API.

Ответить

Развернуть ветку

Dbrain

24.01.2019 Автор

Да конечно, пишите на почту [email protected] все расскажем и покажем.)

Ответить

Развернуть ветку

Станислав Курочкин

24.01.2019

пишите на почту, всё расскажем

Это, ребята, классический пример того, как не надо вести коммуникацию с аудиторией.

Ответить

Развернуть ветку

Frank Wallace

24.01.2019

Ты у нас сегодня грибов поел?

Ответить

Развернуть ветку

Frank Wallace

24.01.2019

Расскажи как надо, я сделаю кофе и вчитаюсь до самого утра.
А?

Ответить

Развернуть ветку

Igor Akimov

24.01.2019

Эм... ABBYY FlexiCapture? https://www.abbyy.com/ru-ru/flexicapture/

ABBYY FlexiCapture. Решение для потокового ввода…

ABBYY FlexiCapture эффективная программа для потокового ввода данных, автоматизирующая извлечение…

www.abbyy.com

Ответить

Развернуть ветку

Dbrain

25.01.2019 Автор

В целом в статье мы говорим, что технология не новая, и на рынке существуют хорошие решения. Фокус нашего продукта в том, что мы совмещаем алгоритм распознавания с ручной проверкой людьми на нашей платформе.

Ответить

Развернуть ветку

Nikita Veselov

24.01.2019

Интересно. А сколько стоит?

Ответить

Развернуть ветку

Dbrain

24.01.2019 Автор

Добрый день, можно написать на почту нашему сотруднику,
он подробно расскажет [email protected]

Ответить

Развернуть ветку

Aleksey Toropchin

24.01.2019

Из контрактов сможете извлекатать участников сделки, условия оплаты, нормы права, даты и т.д.?

Ответить

Развернуть ветку

Dbrain

25.01.2019 Автор

Можем, существующий алгоритм работает с типовыми документами, так же может быть обучение на анкетах и других документах клиента.

Ответить

Развернуть ветку

Dmitry Putincev

25.01.2019

Удивились немного про фото)).... Распознавание паспорта на фотографиях и в видеопотоке на телефоне. Работает в Тинькоффе, Почта Банке, АльфаСтраховании и ...

Применение наших технологий

Извлечение данныхиз документов Распознавайте документы в информационных системах, веб и мобильных…

smartengines.ru

Ответить

Развернуть ветку

Dbrain

25.01.2019 Автор

Конечно, можно работать с изображениями, снятыми телефоном, но точность все еще не 99%, поэтому мы подключаем к процессу краудворкинг и дообучаем алгоритм в процессе работы.

Ответить

Развернуть ветку

Dmitry Putincev

25.01.2019

https://vc.ru/legal/56623-instrukciya-registriruemsya-v-kachestve-samozanyatogo

Инструкция: регистрируемся в качестве…

Как зарегистрироваться в приложении «Мой налог» и чем налоговый режим на профессиональный доход…

vc.ru

Ответить

Развернуть ветку

Написать комментарий...

13 комментариев

Раскрывать всегда