Как и зачем мы внедрили компьютерное зрение в приложение банка

Шел медведь по лесу, видит — машина горит. Он подошел к ней, сел в неё и заметил там номер пожарной. Номер был написан на бумажке, которая вот-вот могла бы исчезнуть в пламени.

Как и зачем мы внедрили компьютерное зрение в приложение банка

Медведь вытащил бумажку, вылез из машины, навёл камеру смартфона на бумажку, считал номер и успел вызвать помощь. Машину потушили, и огонь не пошел дальше в лес.

Если бы не компьютерное зрение и возможность сканировать номер телефона, медведь не смог бы ввести нужные цифры, потому что у него большие мохнатые лапки, и ему тяжело попадать по кнопкам на маленькой клавиатуре смартфона.

Причём здесь МКБ?

В приложении «МКБ Онлайн» тоже есть такая технология. Её сделала российская компания Smart Engines. Теперь наши клиенты могут быстрее и удобнее совершать переводы через СБП. Алгоритмы распознают как рукописный, так и напечатанный номер телефона. Магия происходит сразу же, как только цифры попали в объектив камеры смартфона.

Улучшение клиентского пути и сервиса невозможно без применения новейших технологий. Это особенно важно сегодня, когда конкуренция за клиента выросла. Мы заметили, что есть ситуации, когда людям приходится вводить номер телефона с бумажки — в кафе, в такси, да и вообще при оплате за любые услуги. Ещё просто делать пожертвования уличным музыкантам или другим людям на улице. Так решение Smart Engines помогло сделать опыт наших клиентов удобнее и быстрее. Не зря же мы входим в топ-3 банковских приложений.

Высокое качество и скорость распознавания являются результатом работы ученых и исследователей Smart Engines в области создания новых архитектур сверхлегких нейронных сетей. И мы рады, что благодаря сотрудничеству с МКБ наши научные разработки находят прикладное применение среди миллионов людей по всей стране», — подчеркнул

Владимир Арлазаров, генеральный директор Smart Engines

Как это работает? Глазами ИИ

Сначала мне показали дата сет цифр, печатных и письменных, всё было написано разными кеглями. Потом скинули письменные тексты. Иногда цифры были такими странными, как будто их писал левша, который решил потренировать правую руку.

Меня обучали выборкой из 10 миллионов символов, сгенерированных на основе 16 тысяч шрифтов. Причём это не были не телефонные номера, а просто случайные последовательности цифр, чтобы я научился считывать цифры в любой ситуации. Короче, моё обучение заняло около 3 месяцев, но диплома в конце, почему-то, не дали. Хотя зачем он мне, я же робот.

Затем меня поместили в приложение. Теперь я сижу и жду, когда клиент коснётся пальцем экрана в той точке, которая запустит функцию, ради которой я существую. Когда это происходит — я сразу же ищу номер телефона. Я готов. Я долго обучался. Я смогу. Я нахожу номер, проверяю, и если я уверен, что это номер, то показываю его пользователю. Но если кадр размыт — я пытаюсь сделать ещё несколько кадров, чтобы дополнить картинку и показать клиенту чёткий номер. Поверхность, где написан номер, может быть почти любой: лист бумаги, салфетка, картонка, доска, камень, небо, асфальт. Чем написано — тоже не так важно: ручки, маркеры, печать, мел, следы от резиновых шин. Я умею распознавать текст, даже если фото сделано в движении или в темноте.

Я знаю, о чём вы думаете. Зачем это всё? Почему меня не научили делать мемы?

Потому что в банке решили сделать сервис для клиентов лучше и удобнее. Люди часто пишут номера телефонов от руки или на документах и просят перевести деньги, но, насколько мне известно, многие люди не хотят тратить время на переписывание цифр, которые пригодятся им ровно один раз в жизни.

Вот, для этого меня и создали. Я экономлю время и делаю людей немного счастливее.

88
Начать дискуссию