{"id":14270,"url":"\/distributions\/14270\/click?bit=1&hash=a51bb85a950ab21cdf691932d23b81e76bd428323f3fda8d1e62b0843a9e5699","title":"\u041b\u044b\u0436\u0438, \u043c\u0443\u0437\u044b\u043a\u0430 \u0438 \u0410\u043b\u044c\u0444\u0430-\u0411\u0430\u043d\u043a \u2014 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u0433\u043e\u0440\u0435","buttonText":"\u041d\u0430 \u043a\u0430\u043a\u043e\u0439?","imageUuid":"f84aced9-2f9d-5a50-9157-8e37d6ce1060"}

Как мы наладили оцифровку данных АГС от Сахалина до Севастополя. Опыт федерального уровня

Всем привет! Я представляю команду «Биорг» и расскажу Вам о том, как мы выстроили наш первый федеральный проект по оцифровке актов гражданского состояния (сокращенно АГС) с помощью краудсорсинговой платформы и чему научились в ходе его реализации.

Начнем с того, что оцифровка различных документов, содержащих персональные данные – наша основная специализация. За те несколько лет, что существует компания, мы обработали порядка 30 млн документов и с этим багажом знаний и опыта подошли к реализации крупного проекта федерального уровня, который охватил отделения ЗАГС от Сахалина до Севастополя. О его специфике мы и расскажем.

Итак, почему именно АГС, именно «Биорг» и тем более, краудсорсинговая платформа? А главное – почему это может быть интересно и полезно читателям vc?

В соответствии с Постановлением Правительства № 254 от 03.03.2017 к концу этого года все записи актов гражданского состояния необходимо перевести в электронный вид и загрузить в единую систему ЕГР ЗАГС. Начиная с 1926 года таких записей по стране накопилось более 540 млн. Мы подключились к реализации этой масштабной задачи когда оцифровано было около половины данных. Работать предстояло с книгами актов гражданского состояния. Одна такая книга в среднем содержит 250-300 листов записей о рождении, заключении и расторжении брака, установлении отцовства, записи актов об усыновлении, перемене имени, смерти.

Состояние книг, c которыми нам предстояло работать приводим ниже.

Например, по одной только Воронежской области насчитывалось более 9 млн записей. Представляете, какая масштабная и сложная работа предстояла? Суммарно по этой и другим областям за весь период нами было переведено в электронный вид более 23 млн записей. Все они отражают самые значимые события в жизни людей.

От деперсонализации к реализации

Теперь о том, как был реализован сам проект. Технологически мы разбили его на несколько этапов: сканирование, деперсонализация (резка персональной информации на фрагменты), ручной операторский ввод, аналитика полученных данных, загрузка данных в ПО заказчика.

Самым интересным моментом в этом процессе является, конечно же, этап расшифровки и ввода персональных записей в систему. А они, как вы знаете, защищаются ФЗ-152. Поэтому все личные данные проходили обязательный этап деперсонализации, т.е. сервер нарезал блоками ФИО, адрес, дату АГС, номер АГС, причину смерти и т.д. После резки фрагменты автоматически направлялись операторам ввода.

Мы не использовали стандартный вариант, при котором нанимается несколько человек и они на местах сидят за книгами актов гражданского состояния и занимаются ручным вводом. Такой алгоритм мы даже не рассматривали – он не даст безошибочного ввода и полностью зависит от человеческого фактора (сотрудник может заболеть, уволиться и т.д.), а это всегда влияет на сроки и качество реализации проекта.

Поэтому мы решили подключить ресурсы нашей специализированной краудсорсинговой платформы. В отличие от других платформ ее операторы «заточены» именно на профессиональные темы и работу с личными данными. И наш проект этот профит серьезно повысил. Правда для этого нам пришлось серьезно поработать над тем, чтобы четко разграничить задачи операторов и подготовить понятные и работающие инструкции.

Смотрите, как проходит ручной операторский ввод: оператор получает фрагменты с определенным заданием, например, ввести ФИО, соответственно ему приходят на ввод только фрагменты, относящиеся к типу поля ФИО. Таким образом он вводит только те поля, которые ему удобней вводить – так допустит меньше ошибок. В итоге один оператор вводит ФИО, второй только даты, третий только адреса, и т.д. За счет применения такого рода конвейера достигается скорость и качество ввода данных. Мы добились самого высокого – более 99%.

К каким выводам мы пришли в ходе реализации проекта?

Люди – это очень важно. Даже если они выполняют рутинные задачи и это происходит дистанционно. Ведь именно рутина в конечном итоге определяет качество проекта. Поэтому необходимо поддерживать постоянный контакт и развивать команду. Сейчас мы активно практикуем на нашей платформе рейтинги операторов, новости, учим работать со словарями и специализированными справочниками — все это дает возможность достичь высокой планки в распознавании данных и вовлечь людей в процесс.

Чем может быть полезен наш опыт для Вас?

Возможно именно сегодня, когда все мы переживаем непростой период, который требует переосмысления многих бизнес-процессов, или даже глобальной перестройки бизнеса, наш опыт использования краудсорсинговой платформы покажется интересным и натолкнет Вас на новые идеи.

Отдать в работу операторам можно любой типизированный и рутинный процесс (проверку или сверку данных, ввод, обработку больничных, кадровой документации, чеков, тестов – чего угодно!). Важно лишь четко продумать и выстроить каждую итерацию, подготовить под это понятные и простые инструкции. И вдохнуть в проект душу, увидеть за всем этим простых людей, которым важно иметь работу.

0
12 комментариев
Написать комментарий...
Владислав Сатаров

Интересная реализация.
А как другие ваши коллеги по цеху реализуют подобные задачи?

Ответить
Развернуть ветку
Ксения Цукерман
Автор

Обычно нанимают людей, которые работают с актовыми книгами и вносят данные. Но здесь,  как я уже писала, много сложностей - нужно уметь расшифровывать записи, не отвлекаться и безошибочно вводить данные. А если человек прекращает работу - искать замену и заново погружать в задачу. Ошибки при вводе в ЕГР АГС недопустимы в принципе. 

Ответить
Развернуть ветку
Вадим Скворцов

Привет, не пишите капсом, пожалуйста

Ответить
Развернуть ветку
тима махотлов

Почему нельзя просто сделать высококачественные фото документов и базу из них? Зачем этот гемморой с ручным вводом? Как бы документ потёрт не был мы же носим его в мфц и там его в состоянии прочитать

Ответить
Развернуть ветку
Александр Харитонов

Так суть в электронной базе и поиску по ней. По картинкам просто так не поищешь

Ответить
Развернуть ветку
тима махотлов

Почему? По картинке лица работают же системы?

Ответить
Развернуть ветку
Александр Харитонов

Куча рукописных текстов, записи с 20-х годов, десятки тысяч разных почерков, разных состояний документов, разных форматов и так далее. Распознавание только печатных букв ещё можно кое-как уже сделать, а вот чуть плохое качество оригинала и рукописный текст - все. А ошибка даже в одну букву в фамилии может стоить людям многого

Ответить
Развернуть ветку
тима махотлов

Миллиарды лиц, с миллиардами различий - но все же как то программа находит того кого надо из такого массива информации? И я не говорю про рукописи и тд, можно же взять доки человека от свидетельства о рождении и все остальное - перевести это в цифру чтобы человеку для того что бы сдать на права не надо было месяц ходить бумажки собирать

Ответить
Развернуть ветку
Александр Харитонов

Так о чем речь в статье-то?) Об этом "перевести в цифру" и говорится. И не только ныне живущих, но и всех "предков" с 20-х годов

Ответить
Развернуть ветку
тима махотлов

В статье только акты ГС имеются ввиду, кроме них существуют миллион других доков и всяких справок. Я хочу в любой гос орган заходя не таскать с собой миллион бумажек а пластиковую карту или чтоб все мои данные были в облаке

Ответить
Развернуть ветку
Александр Харитонов

Ну так мы статью обсуждали или как?)
А про перевод в цифру всех документов - подождите, не моментально ведь. Госуслуги, экспериментальные электронные паспорта (погуглите), все будет

Ответить
Развернуть ветку
тима махотлов

Про электронный паспорт я уже лет 10 по моему слышу

Ответить
Развернуть ветку
9 комментариев
Раскрывать всегда