Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня

Всем привет! Я представляю команду «Биорг» и расскажу Вам о том, как мы выстроили наш первый федеральный проект по оцифровке актов гражданского состояния (сокращенно АГС) с помощью краудсорсинговой платформы и чему научились в ходе его реализации.

В закладки

Начнем с того, что оцифровка различных документов, содержащих персональные данные – наша основная специализация. За те несколько лет, что существует компания, мы обработали порядка 30 млн документов и с этим багажом знаний и опыта подошли к реализации крупного проекта федерального уровня, который охватил отделения ЗАГС от Сахалина до Севастополя. О его специфике мы и расскажем.

Итак, почему именно АГС, именно «Биорг» и тем более, краудсорсинговая платформа? А главное – почему это может быть интересно и полезно читателям vc?

В соответствии с Постановлением Правительства № 254 от 03.03.2017 к концу этого года все записи актов гражданского состояния необходимо перевести в электронный вид и загрузить в единую систему ЕГР ЗАГС. Начиная с 1926 года таких записей по стране накопилось более 540 млн. Мы подключились к реализации этой масштабной задачи когда оцифровано было около половины данных. Работать предстояло с книгами актов гражданского состояния. Одна такая книга в среднем содержит 250-300 листов записей о рождении, заключении и расторжении брака, установлении отцовства, записи актов об усыновлении, перемене имени, смерти.

Состояние книг, c которыми нам предстояло работать приводим ниже.

Например, по одной только Воронежской области насчитывалось более 9 млн записей. Представляете, какая масштабная и сложная работа предстояла? Суммарно по этой и другим областям за весь период нами было переведено в электронный вид более 23 млн записей. Все они отражают самые значимые события в жизни людей.

От деперсонализации к реализации

Теперь о том, как был реализован сам проект. Технологически мы разбили его на несколько этапов: сканирование, деперсонализация (резка персональной информации на фрагменты), ручной операторский ввод, аналитика полученных данных, загрузка данных в ПО заказчика.

Самым интересным моментом в этом процессе является, конечно же, этап расшифровки и ввода персональных записей в систему. А они, как вы знаете, защищаются ФЗ-152. Поэтому все личные данные проходили обязательный этап деперсонализации, т.е. сервер нарезал блоками ФИО, адрес, дату АГС, номер АГС, причину смерти и т.д. После резки фрагменты автоматически направлялись операторам ввода.

Мы не использовали стандартный вариант, при котором нанимается несколько человек и они на местах сидят за книгами актов гражданского состояния и занимаются ручным вводом. Такой алгоритм мы даже не рассматривали – он не даст безошибочного ввода и полностью зависит от человеческого фактора (сотрудник может заболеть, уволиться и т.д.), а это всегда влияет на сроки и качество реализации проекта.

Поэтому мы решили подключить ресурсы нашей специализированной краудсорсинговой платформы. В отличие от других платформ ее операторы «заточены» именно на профессиональные темы и работу с личными данными. И наш проект этот профит серьезно повысил. Правда для этого нам пришлось серьезно поработать над тем, чтобы четко разграничить задачи операторов и подготовить понятные и работающие инструкции.

Смотрите, как проходит ручной операторский ввод: оператор получает фрагменты с определенным заданием, например, ввести ФИО, соответственно ему приходят на ввод только фрагменты, относящиеся к типу поля ФИО. Таким образом он вводит только те поля, которые ему удобней вводить – так допустит меньше ошибок. В итоге один оператор вводит ФИО, второй только даты, третий только адреса, и т.д. За счет применения такого рода конвейера достигается скорость и качество ввода данных. Мы добились самого высокого – более 99%.

К каким выводам мы пришли в ходе реализации проекта?

Люди – это очень важно. Даже если они выполняют рутинные задачи и это происходит дистанционно. Ведь именно рутина в конечном итоге определяет качество проекта. Поэтому необходимо поддерживать постоянный контакт и развивать команду. Сейчас мы активно практикуем на нашей платформе рейтинги операторов, новости, учим работать со словарями и специализированными справочниками — все это дает возможность достичь высокой планки в распознавании данных и вовлечь людей в процесс.

Чем может быть полезен наш опыт для Вас?

Возможно именно сегодня, когда все мы переживаем непростой период, который требует переосмысления многих бизнес-процессов, или даже глобальной перестройки бизнеса, наш опыт использования краудсорсинговой платформы покажется интересным и натолкнет Вас на новые идеи.

Отдать в работу операторам можно любой типизированный и рутинный процесс (проверку или сверку данных, ввод, обработку больничных, кадровой документации, чеков, тестов – чего угодно!). Важно лишь четко продумать и выстроить каждую итерацию, подготовить под это понятные и простые инструкции. И вдохнуть в проект душу, увидеть за всем этим простых людей, которым важно иметь работу.

{ "author_name": "Ксения Цукерман", "author_type": "self", "tags": [], "comments": 12, "likes": 2, "favorites": 5, "is_advertisement": false, "subsite_label": "tribuna", "id": 122335, "is_wide": false, "is_ugc": true, "date": "Thu, 23 Apr 2020 08:09:00 +0300", "is_special": false }
Промо
Коротко: скоростная и надёжная система хранения данных Huawei — протестируйте бесплатно
Можно проверить работу бизнес-сервисов на All-Flash СХД.
Объявление на vc.ru
0
12 комментариев
Популярные
По порядку
Написать комментарий...
0

Интересная реализация.
А как другие ваши коллеги по цеху реализуют подобные задачи?

Ответить
1

Обычно нанимают людей, которые работают с актовыми книгами и вносят данные. Но здесь,  как я уже писала, много сложностей - нужно уметь расшифровывать записи, не отвлекаться и безошибочно вводить данные. А если человек прекращает работу - искать замену и заново погружать в задачу. Ошибки при вводе в ЕГР АГС недопустимы в принципе. 

Ответить
0

Привет, не пишите капсом, пожалуйста

Ответить
0

Почему нельзя просто сделать высококачественные фото документов и базу из них? Зачем этот гемморой с ручным вводом? Как бы документ потёрт не был мы же носим его в мфц и там его в состоянии прочитать

Ответить
0

Так суть в электронной базе и поиску по ней. По картинкам просто так не поищешь

Ответить
0

Почему? По картинке лица работают же системы?

Ответить
0

Куча рукописных текстов, записи с 20-х годов, десятки тысяч разных почерков, разных состояний документов, разных форматов и так далее. Распознавание только печатных букв ещё можно кое-как уже сделать, а вот чуть плохое качество оригинала и рукописный текст - все. А ошибка даже в одну букву в фамилии может стоить людям многого

Ответить
0

Миллиарды лиц, с миллиардами различий - но все же как то программа находит того кого надо из такого массива информации? И я не говорю про рукописи и тд, можно же взять доки человека от свидетельства о рождении и все остальное - перевести это в цифру чтобы человеку для того что бы сдать на права не надо было месяц ходить бумажки собирать

Ответить
0

Так о чем речь в статье-то?) Об этом "перевести в цифру" и говорится. И не только ныне живущих, но и всех "предков" с 20-х годов

Ответить
0

В статье только акты ГС имеются ввиду, кроме них существуют миллион других доков и всяких справок. Я хочу в любой гос орган заходя не таскать с собой миллион бумажек а пластиковую карту или чтоб все мои данные были в облаке

Ответить
0

Ну так мы статью обсуждали или как?)
А про перевод в цифру всех документов - подождите, не моментально ведь. Госуслуги, экспериментальные электронные паспорта (погуглите), все будет

Ответить
0

Про электронный паспорт я уже лет 10 по моему слышу

Ответить

Комментарии