Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня

Всем привет! Я представляю команду «Биорг» и расскажу Вам о том, как мы выстроили наш первый федеральный проект по оцифровке актов гражданского состояния (сокращенно АГС) с помощью краудсорсинговой платформы и чему научились в ходе его реализации.

Начнем с того, что оцифровка различных документов, содержащих персональные данные – наша основная специализация. За те несколько лет, что существует компания, мы обработали порядка 30 млн документов и с этим багажом знаний и опыта подошли к реализации крупного проекта федерального уровня, который охватил отделения ЗАГС от Сахалина до Севастополя. О его специфике мы и расскажем.

Итак, почему именно АГС, именно «Биорг» и тем более, краудсорсинговая платформа? А главное – почему это может быть интересно и полезно читателям vc?

В соответствии с Постановлением Правительства № 254 от 03.03.2017 к концу этого года все записи актов гражданского состояния необходимо перевести в электронный вид и загрузить в единую систему ЕГР ЗАГС. Начиная с 1926 года таких записей по стране накопилось более 540 млн. Мы подключились к реализации этой масштабной задачи когда оцифровано было около половины данных. Работать предстояло с книгами актов гражданского состояния. Одна такая книга в среднем содержит 250-300 листов записей о рождении, заключении и расторжении брака, установлении отцовства, записи актов об усыновлении, перемене имени, смерти.

Состояние книг, c которыми нам предстояло работать приводим ниже.

Например, по одной только Воронежской области насчитывалось более 9 млн записей. Представляете, какая масштабная и сложная работа предстояла? Суммарно по этой и другим областям за весь период нами было переведено в электронный вид более 23 млн записей. Все они отражают самые значимые события в жизни людей.

От деперсонализации к реализации

Теперь о том, как был реализован сам проект. Технологически мы разбили его на несколько этапов: сканирование, деперсонализация (резка персональной информации на фрагменты), ручной операторский ввод, аналитика полученных данных, загрузка данных в ПО заказчика.

Самым интересным моментом в этом процессе является, конечно же, этап расшифровки и ввода персональных записей в систему. А они, как вы знаете, защищаются ФЗ-152. Поэтому все личные данные проходили обязательный этап деперсонализации, т.е. сервер нарезал блоками ФИО, адрес, дату АГС, номер АГС, причину смерти и т.д. После резки фрагменты автоматически направлялись операторам ввода.

Мы не использовали стандартный вариант, при котором нанимается несколько человек и они на местах сидят за книгами актов гражданского состояния и занимаются ручным вводом. Такой алгоритм мы даже не рассматривали – он не даст безошибочного ввода и полностью зависит от человеческого фактора (сотрудник может заболеть, уволиться и т.д.), а это всегда влияет на сроки и качество реализации проекта.

Поэтому мы решили подключить ресурсы нашей специализированной краудсорсинговой платформы. В отличие от других платформ ее операторы «заточены» именно на профессиональные темы и работу с личными данными. И наш проект этот профит серьезно повысил. Правда для этого нам пришлось серьезно поработать над тем, чтобы четко разграничить задачи операторов и подготовить понятные и работающие инструкции.

Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня

Смотрите, как проходит ручной операторский ввод: оператор получает фрагменты с определенным заданием, например, ввести ФИО, соответственно ему приходят на ввод только фрагменты, относящиеся к типу поля ФИО. Таким образом он вводит только те поля, которые ему удобней вводить – так допустит меньше ошибок. В итоге один оператор вводит ФИО, второй только даты, третий только адреса, и т.д. За счет применения такого рода конвейера достигается скорость и качество ввода данных. Мы добились самого высокого – более 99%.

Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня
Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня

К каким выводам мы пришли в ходе реализации проекта?

Люди – это очень важно. Даже если они выполняют рутинные задачи и это происходит дистанционно. Ведь именно рутина в конечном итоге определяет качество проекта. Поэтому необходимо поддерживать постоянный контакт и развивать команду. Сейчас мы активно практикуем на нашей платформе рейтинги операторов, новости, учим работать со словарями и специализированными справочниками — все это дает возможность достичь высокой планки в распознавании данных и вовлечь людей в процесс.

Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня

Чем может быть полезен наш опыт для Вас?

Возможно именно сегодня, когда все мы переживаем непростой период, который требует переосмысления многих бизнес-процессов, или даже глобальной перестройки бизнеса, наш опыт использования краудсорсинговой платформы покажется интересным и натолкнет Вас на новые идеи.

Отдать в работу операторам можно любой типизированный и рутинный процесс (проверку или сверку данных, ввод, обработку больничных, кадровой документации, чеков, тестов – чего угодно!). Важно лишь четко продумать и выстроить каждую итерацию, подготовить под это понятные и простые инструкции. И вдохнуть в проект душу, увидеть за всем этим простых людей, которым важно иметь работу.

2
12 комментариев

Интересная реализация.
А как другие ваши коллеги по цеху реализуют подобные задачи?

Ответить

Обычно нанимают людей, которые работают с актовыми книгами и вносят данные. Но здесь,  как я уже писала, много сложностей - нужно уметь расшифровывать записи, не отвлекаться и безошибочно вводить данные. А если человек прекращает работу - искать замену и заново погружать в задачу. Ошибки при вводе в ЕГР АГС недопустимы в принципе. 

1
Ответить

Привет, не пишите капсом, пожалуйста

Ответить

Почему нельзя просто сделать высококачественные фото документов и базу из них? Зачем этот гемморой с ручным вводом? Как бы документ потёрт не был мы же носим его в мфц и там его в состоянии прочитать

Ответить

Так суть в электронной базе и поиску по ней. По картинкам просто так не поищешь

Ответить