Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня
Всем привет! Я представляю команду «Биорг» и расскажу Вам о том, как мы выстроили наш первый федеральный проект по оцифровке актов гражданского состояния (сокращенно АГС) с помощью краудсорсинговой платформы и чему научились в ходе его реализации.
Начнем с того, что оцифровка различных документов, содержащих персональные данные – наша основная специализация. За те несколько лет, что существует компания, мы обработали порядка 30 млн документов и с этим багажом знаний и опыта подошли к реализации крупного проекта федерального уровня, который охватил отделения ЗАГС от Сахалина до Севастополя. О его специфике мы и расскажем.
Итак, почему именно АГС, именно «Биорг» и тем более, краудсорсинговая платформа? А главное – почему это может быть интересно и полезно читателям vc?
В соответствии с Постановлением Правительства № 254 от 03.03.2017 к концу этого года все записи актов гражданского состояния необходимо перевести в электронный вид и загрузить в единую систему ЕГР ЗАГС. Начиная с 1926 года таких записей по стране накопилось более 540 млн. Мы подключились к реализации этой масштабной задачи когда оцифровано было около половины данных. Работать предстояло с книгами актов гражданского состояния. Одна такая книга в среднем содержит 250-300 листов записей о рождении, заключении и расторжении брака, установлении отцовства, записи актов об усыновлении, перемене имени, смерти.
Состояние книг, c которыми нам предстояло работать приводим ниже.
Например, по одной только Воронежской области насчитывалось более 9 млн записей. Представляете, какая масштабная и сложная работа предстояла? Суммарно по этой и другим областям за весь период нами было переведено в электронный вид более 23 млн записей. Все они отражают самые значимые события в жизни людей.
От деперсонализации к реализации
Теперь о том, как был реализован сам проект. Технологически мы разбили его на несколько этапов: сканирование, деперсонализация (резка персональной информации на фрагменты), ручной операторский ввод, аналитика полученных данных, загрузка данных в ПО заказчика.
Самым интересным моментом в этом процессе является, конечно же, этап расшифровки и ввода персональных записей в систему. А они, как вы знаете, защищаются ФЗ-152. Поэтому все личные данные проходили обязательный этап деперсонализации, т.е. сервер нарезал блоками ФИО, адрес, дату АГС, номер АГС, причину смерти и т.д. После резки фрагменты автоматически направлялись операторам ввода.
Мы не использовали стандартный вариант, при котором нанимается несколько человек и они на местах сидят за книгами актов гражданского состояния и занимаются ручным вводом. Такой алгоритм мы даже не рассматривали – он не даст безошибочного ввода и полностью зависит от человеческого фактора (сотрудник может заболеть, уволиться и т.д.), а это всегда влияет на сроки и качество реализации проекта.
Поэтому мы решили подключить ресурсы нашей специализированной краудсорсинговой платформы. В отличие от других платформ ее операторы «заточены» именно на профессиональные темы и работу с личными данными. И наш проект этот профит серьезно повысил. Правда для этого нам пришлось серьезно поработать над тем, чтобы четко разграничить задачи операторов и подготовить понятные и работающие инструкции.
Смотрите, как проходит ручной операторский ввод: оператор получает фрагменты с определенным заданием, например, ввести ФИО, соответственно ему приходят на ввод только фрагменты, относящиеся к типу поля ФИО. Таким образом он вводит только те поля, которые ему удобней вводить – так допустит меньше ошибок. В итоге один оператор вводит ФИО, второй только даты, третий только адреса, и т.д. За счет применения такого рода конвейера достигается скорость и качество ввода данных. Мы добились самого высокого – более 99%.
К каким выводам мы пришли в ходе реализации проекта?
Люди – это очень важно. Даже если они выполняют рутинные задачи и это происходит дистанционно. Ведь именно рутина в конечном итоге определяет качество проекта. Поэтому необходимо поддерживать постоянный контакт и развивать команду. Сейчас мы активно практикуем на нашей платформе рейтинги операторов, новости, учим работать со словарями и специализированными справочниками — все это дает возможность достичь высокой планки в распознавании данных и вовлечь людей в процесс.
Чем может быть полезен наш опыт для Вас?
Возможно именно сегодня, когда все мы переживаем непростой период, который требует переосмысления многих бизнес-процессов, или даже глобальной перестройки бизнеса, наш опыт использования краудсорсинговой платформы покажется интересным и натолкнет Вас на новые идеи.
Отдать в работу операторам можно любой типизированный и рутинный процесс (проверку или сверку данных, ввод, обработку больничных, кадровой документации, чеков, тестов – чего угодно!). Важно лишь четко продумать и выстроить каждую итерацию, подготовить под это понятные и простые инструкции. И вдохнуть в проект душу, увидеть за всем этим простых людей, которым важно иметь работу.
Интересная реализация.
А как другие ваши коллеги по цеху реализуют подобные задачи?
Обычно нанимают людей, которые работают с актовыми книгами и вносят данные. Но здесь, как я уже писала, много сложностей - нужно уметь расшифровывать записи, не отвлекаться и безошибочно вводить данные. А если человек прекращает работу - искать замену и заново погружать в задачу. Ошибки при вводе в ЕГР АГС недопустимы в принципе.
Привет, не пишите капсом, пожалуйста
Почему нельзя просто сделать высококачественные фото документов и базу из них? Зачем этот гемморой с ручным вводом? Как бы документ потёрт не был мы же носим его в мфц и там его в состоянии прочитать
Так суть в электронной базе и поиску по ней. По картинкам просто так не поищешь