Dbrain

+1100
с 2018

Мы сервис извлечения данных из документов. Работаем с паспортами, ВУ, СТС, договорами и первичной документацией. Используем ИИ вместо времени ваших сотрудников

200 подписчиков
20 подписок

Странная у вас статистика. У нас зарплата выше рынка, а вот печенек нет. Печеньками ипотеку не закроешь)

Это совместный проект со Skillaz, который стартовал с распознавания печатных паспортов. Мы не интегрировали туда распознавание рукописки, но будем это делать, как только у коллег появится такой запрос. В других своих проектах мы распознаём рукописку

Для каждой привычки и человека свои тайминги) У кого-то получится за 21 день, у кого-то за несколько месяцев.

1

Про мотивацию отдельную статью сделаем, чтобы разобраться)

2

о, это очень хороший вопрос.

чтобы система работала в контуре, но можно было подключить Толоку к верификации у нас есть алгоритм для депресонализации данных. Его используют многие крупные заказчики у нас.

Персональными данными является комбинация данных - например ФИО + телефон или серия номер + дата рождения. На стороне клиента сервис разделяет документ на отдельные поля и дальше они уходят к нам. Мы у себя проверяем, чтобы данные из 1 документа не попали на одного и того же верификатора, тем самым у них никогда не окажутся перс данные

1

lдумаю дело в том, что они используют свое распознавание, а не наше :)

таких нет, к сожалению. Это одно из самых сложных решений, которое делали с 0 последний год

мы работаем за пределами СНГ с английским, испанским, португальским и еще парой языков)

2

мы хотим сделать такую статью на хабре вначале года. LayoutLM мы правда используем, а вот Tesseract совсем старый и скучный. В OCR у нас очень много архитектур, часть число CV, часть знают информацию про язык

2

такое без проблем находится как подделка) у нас около 90% сейчас

1

был такой кейс на сортировочной ленте в почте. Иногда штрих код не читаем, а цифры под ним читаемы.

1

все чуть сложнее, но направления вашей мысли правильное

2

это не фотошоп уже. Мы ищем именно следы цифровой подделки.

В статье говорили о селфи.
Для мошенников есть детектор фрода и сравнение лиц. А по поводу Госуслуг, если к нам обратятся, мы с радостью пофиксим проблемы)

2

Ждали такого вопроса! Там же речь идет о YC — по сравнению с ним, PNP сравнительно новый и менее известный) 

Привет! Дима дипфэйк не создавал — в статье выше есть целый раздел, в котором очень подробно рассказываем, кто стоит за фродом. Вот его максимально краткий пересказ: это брокер Barclay Stone

1

Заморачиваются, потому что технологии — это довольно увлекательно)

А по поводу суда — мы приняли уже все возможные меры, чтобы не допустить дальнейшего обмана наших друзей

3

Денис, есть два способа использования нашего продукта:

1) В IT-контуре клиента — в этом случае клиент сам обеспечивает соблюдение 152 ФЗ;

2) В облаке — в этом случае клиент получает согласие от своих клиентов на обработку данных Dbrain, а мы подписываем с клиентом соответствующее соглашение, разрешающее обработку данных. Обработка происходит на серверах Selectel, которые имеют аттестат соответствия требованиям безопасности информации № 181007/1-АС/К и лицензии ФСТЭК и ФСБ для оказания услуг в области защиты информации.

Передача данных осуществляет по протоколам с применением крипто-защиты. Dbrain не хранит клиентские данные.

1

Руслан, у нас серверное решение, которое может использоваться как в облаке, так и в контуре клиента. Мы не храним клиентские данные. Вся обработка происходит в соответствии с 152 ФЗ.