Техника
Vladimir Arlazarov
6818

По пути Папы Карло: от деревянного сканера к реальному бизнесу

Сейчас, когда каждый из нас послушно сидит на самоизоляции, мы искренне скучаем по офису, разработке и изобретательству. Помимо софта мы в Smart Engines изобретаем сканирующие программно-аппаратные комплексы. Расскажу о том, как фанерную коробочку с камерой мы довели до полноценного продукта.

В закладки
Аудио
Smart Engines

Пару слов о том, зачем вообще мы занимаемся изобретением программно-аппаратных комплексов (ПАК). Разве не эффективнее сосредоточить все силы чисто на написании софта? Тут есть несколько соображений.

Во-первых, распознающие программы часто используются в паре с устройством оцифровки документов. Конечно, в последнее время появляется все больше «цифровых» компаний, которые забыли (а в некоторых случаях даже и не знали) про бумагу.

Тем не менее, даже если вы разработаете универсальную программу, которая будет совсем неприхотлива и совместима со всеми компьютерами, камерами, сканерами, МФУ, телефонами, планшетами, документными сканерами (прямо как наша Smart IDReader), все равно будьте готовы на презентациях назвать - то есть, извините, - рекомендовать устройства, необходимые для решения задачи ввода паспортных данных.

Во-вторых, по нашему опыту, специальный ПАК зачастую решает задачу намного лучше, а программные и аппаратные части взаимодействуют друг с другом стабильнее, чем если бы это была «сборная солянка». Это легко объяснить на пальцах: за счет ограничения в моделях отладка и тестирование софта и оборудования оказываются проще, что, естественно, повышает общее качество решения.

Кстати, именно по этой причине софт для iPhone (для которых в каждый момент времени актуальны не более 5–6 моделей) работает стабильнее, чем софт для Android-телефонов. Но это совсем другая история, не будем в нее углубляться.

И, наконец, в-третьих, ПАК — это что-то физически осязаемое. У ПАК есть физические размеры, масса, цвет и даже запах (кто из нас не любит запах новой техники?). А еще у ПАК, в отличие от того же софта, есть НДС 20%, но про эту неприятную часть бизнеса чуть позже. Давайте переходить к основному содержанию сегодняшней статьи.

Как мы решились делать паспортные сканеры

Как ни странно, но понимание о необходимости создать устройство сканирования паспортов пришло к нам после того, как мы выпустили свою первую программу распознавания. Пять лет назад мы выпустили первое решение по распознаванию паспорта — Smart PassportReader.

Мы безумно гордились достигнутыми ТТХ — распознавание изображения паспорта занимало доли секунды на средненьком ПК. И тут, когда мы начали широким фронтом предлагать решение на рынке, то были ошарашены одним занимательным фактом: «Зачем распознавать так быстро, если сканирование документа длится не меньше 5 секунд?»

Да-да, это обычная скорость работы типичных планшетных сканеров. Конечно, есть специальные быстрые сканирующие устройства, но и цена у них оказалась «специальной». А как вы понимаете, рынок всегда хочет видеть качественные и недорогие вещи!

Так мы решили сделать свое устройство. Мы щедро выделили на это устройство $100, не уменьшая при этом требований к качеству и скорости получения изображений. Первое (и самое очевидное), что пришло в голову — использование хорошей web-камеры. Тем более распознавать видео мы умеем хорошо.

Правда, работа с web-камерой требует определенной сноровки: нужно точно позиционировать документ, правильно держать паспорт (не забываем, что паспорт выполнен в виде книжечки), учитывать особенности рабочего место и осветительных приборов (чтобы избежать бликов) и так далее.

Немного поразмыслив, мы решили установить камеру внутрь замкнутого корпуса со стеклянной «крышкой», про который известно все: расстояние от камеры до документа (можно фиксировать фокусное расстояние), параметры освещения всегда одинаковы и не зависят от внешних факторов, паспорт прижимается к стеклянной поверхности, что позволяет легко избежать эффекта книжки.

За длинные холодные зимние каникулы, вооружившись досками и отвертками вместо сноубордов и лыж, мы начали творить устройство. Из дерева.

Smart Engines

Несмотря на кажущуюся простоту, получившееся устройство обладает своими нюансами:

  • взаимное расположение камеры и светодиодной подсветки должны подбираться исходя из уменьшения возможного отражения от стеклянной рабочей поверхности;
  • мощность светодиодной подсветки должна быть достаточной для нормального функционирования камеры, при этом зоны документа не должны быть засвечены;
  • расстояние от камеры до рабочей поверхности должно быть подобрано так, чтобы получить документ в максимальном разрешении.

А вот краткая смета стройматериалов, которые пошли на изготовление. Как видите, в заветные 100 долларов мы уложились с запасом.

  • Мебельные панели (ЛДСП) 16 мм 200 рублей.

  • Стекло оконное 4 мм 100 рублей.
  • Фурнитура (саморезы + держатели + планка) 200 рублей.

  • Светодиоды, батарейки, провода 500 рублей.
  • FullHD web-камера 5000 рублей.

Вот как работал наш деревянный друг на практике:

Буквально сразу же после успешных испытаний получившегося сканера мы поняли, что пустое пространство внутри следует использовать по назначению: расположить вычислительный модуль, чтобы перенести всю нагрузку по распознаванию на плечи сканера.

Так мы пришли к автономному сканирующему устройству. За счет широкого спектра интерфейсов возврата распознанной информации (наш автономный сканер паспортов умеет даже «притворяться клавиатурой», чтобы возвращать распознанные данные) сканер мог использоваться даже в тех случаях, где присутствуют проблемы с интеграцией сторонних программ.

Демонстрация работы нашего первого автономного паспортного сканера

От поделки к бизнесу

Достигнутый успех мы решили трансформировать в рабочий бизнес. И сейчас опишем шаги, которые мы сделали ради этого (ведь vc.ru — площадка для описания бизнеса и технологий, а не для инструкций о том, как скручивать два листа ЛДСП).

Итак, первый шаг, который мы сделали, обеспечили себя правовой защитой, подав заявки на регистрацию изобретений и полезных моделей.

Без какого-либо сарказма заявляем, что наличие честных зарегистрированных результатов интеллектуальной деятельности (РИД) — очень важный элемент бизнеса, который выстреливает несколько раз: обеспечивает правовую защиту продуктов, поднимает стоимость компании, повышает доверие со стороны партнеров и контрагентов.

С патентами тянуть не стоит, зачастую достаточно рабочего прототипа, а иногда даже четко описанной идеи. Мы зарегистрировали как патент на полезную модель, так и патент на изобретение:

  • Патент на полезную модель № 166038 «Автоматизированное рабочее место контроля паспортных документов».
  • Патент на изобретение № 2643130 «Автоматизированное рабочее место контроля паспортных документов».

Вторым шагом был выбор организационной формы нашего нового направления. Понимая, что серьезное развитие нового бизнес-направления потребует полного задействования наших административных ресурсов и может нанести серьезный урон нашему основному направлению — разработке распознающего софта, мы приняли решение о создании спин-оффа.

Точнее, сразу двух: первый должен развивать «простую и дешевую» модификацию паспортного сканера для масс-маркета, а второй — наладить производство «продвинутых и дорогих» устройств, содержащих внутри автономные вычислители для решения задачи распознавания. За собой мы оставили важную роль супервайзера.

Идея разбить бизнес паспортных сканеров на два независимых направления была совсем не случайна. Хотя на тот момент у нас практически не было опыта производства конечного изделия, мы четко видели разницу между двумя классами устройств (и это разница была не только в функциональных характеристиках, но и конструкторских особенностях, организации производственного процесса, рынках сбыта).

Для развития первого класса устройств («дешевых» сканеров для масс-сегмента) мы искали команду, способную быстро организовать малый бизнес и поставить на конвейер первые серийные образцы, выполняя развитие и модернизацию сканера в процессе жизненного цикла.

К счастью, нам удалось найти ребят, которые взяли на себя всю рутинную работу по разработке нормального корпуса (напомню, в первых образцах он был ил ЛДСП), сертификации, производства и логистики.

Знали бы вы, сколько термопластика было израсходовано прежде, чем удалось изготовить пригодные для конвейерной сборки и последующей эксплуатации корпуса! В результате вышло надежное устройство, крайне востребованное особенно при организации СКУД и гостиничном бизнесе.

Smart Engines

Маленький отступ к бухгалтерской составляющей и способу реализации товара. Несмотря на то, что ПАК является целостным устройством, выполняющим понятную бизнес-функцию (распознавание документов), для конечных клиентов с точки зрения налогов оказывается более выгодна продажа его «по частям»: отдельно сканер паспортов (облагается НДС 20%), отдельно софт (не облагается НДС).

При такой схеме не происходит «лишней» накрутки налога на распознающий софт (который по факту немало стоит). Несмотря на финансовое преимущество, у этой схемы есть недостаток: в случае возврата ПАК (при поломке аппаратной части или какой-либо другой причине) вернуть удастся только стоимость непосредственно сканера.

Устройства второго класса («дорогие» автономные модели) по нашему замыслу должны были производиться на серьезном российском (лучше — оборонном) предприятии и быть работоспособными в самых непредсказуемых условиях. А еще выглядеть солидно.

Smart Engines

Серьезность наших намерений закономерно потребовала от нас большего вложения сил. Выбранный нами оборонный завод не хотел запускать производство по простым «чертежам на клетчатой бумаге».

Нам пришлось разработать полный комплект конструкторской документации, чтобы хоть как-то приблизиться к заветной цели. Потом мы столкнулись с проблемами поставки комплектующих из-за границы (про это, если вдруг вам интересно, мы напишем отдельный пост с перечислением рабочих лайфхаков).

Организация линии сборки, обеспечение процедуры тестирования готового изделия, проработка схемы обновления встроенного программного обеспечения — все это новые дисциплины, с которыми нам, разработчикам софта, пришлось в оперативном режиме ознакомиться. Хотя, с другой стороны, это было время частых командировок! Но главное — достойный результат, которым мы гордимся!

А что после наладки производства?

Прошло уже где-то два года с того момента, как мы закончили организацию производства обоих классов устройств. Наблюдая, как растут объемы продаж, мы понимаем, что наши сканеры нашли свою целевую аудиторию.

Приятно осознавать, что твое изобретение (в прошлом — фанерный ящик, скрученный на даче шуруповертом) сегодня помогает людям быстрее справляться с рутиной ввода персональных данных. Конечно, пока не все проходные, офисы финансовых организаций и билетные кассы оборудованы нашими сканерами, мы твердо видим вектор в светлое будущее и четко следуем выбранному направлению.

Рубрика «Вопросы и ответы»

В процессе экспериментальной разработки и производства мы постоянно наталкивались на «критику» и предсказание фейла. В конце нашей статьи хотим «пересказать» эту критику в формате «вопрос-ответ»

1. Паспорта все равно не будут распознаваться качественно. Шрифт в паспортах разный, текст печатается со смещением, нет полных баз фамилий, имен и отчеств, не говоря уже об органах выдачи

Это наш любимый вопрос. Мы разработали свой собственный софт распознавания документов — Smart IDReader, который точно распознает омнифонтовое заполнение и рукопись, делая это без всяких баз, умеет находить и классифицировать документы в условиях разного освещения, ракурсов съемки и много еще чего умеет, даже проверять подлинность документов.

2. Для качественной работы нужна качественная камера и оптика. Они стоят дорого, никто не будет много платить за такие устройства.

Качество светочувствительной матрицы и линзы должно быть ровно таким, чтобы обеспечивать высокий уровень распознавания с помощью конкретной программы.

Поэтому в данном случае все зависит только от софта. Мы смогли научить систему качественно распознавать изображения, полученные на китайскую камеру за $50.

3. Ваш прибор — это просто камера в ящике. Что тут хитрого?

Просчитанная оптическая система сканера включает не только выбор модели камеры, но и подбор других элементов (подсветка, светоотражатели, рабочую поверхность), а также взаиморасположение всех перечисленных элементов.

Если пропустить этот важный этап создания сканирующего устройства, а просто тупо засунуть камеру в ящик, то результат будет очень посредственный, даже при использовании хорошей камеры и линзы.

4. Весь распознающий софт и драйвера таких специфических устройств работают только под Windows. А бизнес сейчас смотрит в сторону открытых операционных систем.

Smart IDReader поддерживает целый спектр процессорных архитектур и совместим с огромным количеством операционных систем (см. спецификацию). Мы работаем даже на такой экзотике, как «Эльбрус» и «Комдив».

5. Одним паспортом РФ не ограничится. Надо поддерживать все документы, иначе смысла нет. А сделать это не получится, так как достать шаблоны всех паспортов мира шансов нет.

Насчет шаблонов для других стран, конечно, никто не дает изображения, содержащие персональные данные, — это просто нарушает закон. Но существуют базы данных, в которых есть образцы (изображения) паспортов всех стран. И тут опять вопрос к софту — достаточно ли будет такого общедоступного изображения для качественного решения задачи? Нам — хватает.

{ "author_name": "Vladimir Arlazarov", "author_type": "self", "tags": [], "comments": 35, "likes": 33, "favorites": 44, "is_advertisement": false, "subsite_label": "tech", "id": 128962, "is_wide": false, "is_ugc": true, "date": "Fri, 22 May 2020 12:26:07 +0300", "is_special": false }
Маркетинг
Как бизнесу заработать в соцсетях в 2020 году: полноценное руководство с прогнозами и примерами
Пошаговая рабочая стратегия продвижения бизнеса в соцсетях с медиапланом и примерами внедрения от директора «Студии…
Объявление на vc.ru
0
35 комментариев
Популярные
По порядку
Написать комментарий...
9

очень вдохновляет статья, просто респект!
А токсиков в комментов не слушайте, 99% они ничего не сделали, только хейтят от злости и может от зависти)

Ответить
5

По пути Папы Карло: от торговли деревянными изделиями в Химках  к реальному бизнесу

Ответить
4

"Потом мы столкнулись с проблемами поставки комплектующих из-за границы (про это, если вдруг вам интересно, мы напишем отдельный пост с перечислением рабочих лайфхаков)" Да, интересно.

Ответить
1

Может быть тайну расскажу, но есть adobe scan, где не надо собирать из говна и палок новый велосипед)

Ответить
3

А еще есть Microsoft Lens, сканеров полно и это все софт решения. Не будет же оператор фотографировать на свой телефон, а потом заносить в АРМ. В данном случае готовое решение, интегрировал и пользуйся.

Ответить
1

Да, мобильные сканеры - изобретение известное. У нас тоже есть такое решение. У нас даже есть полноценная система распознавания документов Smart IDReader (https://apps.apple.com/ru/app/smart-idreader/id1157877082).
И, кстати, всё распознавание выполняется на на устройстве, без сторонних сервисов.

Тут история другая. Паспортные сканеры позволяют автоматизировать АРМ в офисах.

Ответить
1

правильно!
давайте всё бабло за хард&софт сливать на запад, вместе с персональными данными!
а потом мешки денег на поиск утечек информации выделять. такъ победимъ и с колен подпрыгнем.

Ответить
2

В свое время работал операционистом в банке. Тоннами сканировали паспорта. Эхх, мне бы ваше устройство тогда, сколько бы времени сэкономил))
Респект за изобретение!

Ответить
1

1. Патентование проводили самостоятельно или через патентное бюро?
2. Не было проблем с получением патента на изобретение? Будете ли делать национальные патенты?
3. Если не сложно, то расскажите пожалуйста про сертификацию прибора - что, для чего, как и за какие деньги 

Ответить
2

1. Через патентного поверенного
2. Все прошло без проблем, надо национальными патентами думаем.
3. Этот процесс мы тоже отдали на аутсорс, деньги были относительно не большие, уточню в бухгалтерии в понедельник.

Ответить
0

Изучил перечень продукции, подлежащей обязательной сертификации, и вроде как теперь коды 4013, 4017, 4020, 4030, 4040 (устройства) исключены из списка. У вас есть какая-то информация по этому поводу?

Ответить
2

Нас клиенты с самого начала спрашивали о сертификации, мы сделали, затраты конечно, но что делать. Насчет, текущей ситуации - надо запрашивать юристов, но по нашему опыту: заказчик сертификаты спрашивает, так что лучше его иметь.

Ответить
1

Молодцы!
Вопрос почему ограничение видом документа только паспорт? Есть же снилс, ву и тд. Или это уже версия 2.0 будет )

Ответить
1

Паспорт это ограничение по размеру зоны сканирования, она сделана по размеру паспорта РФ. Если документ имеет размер такой же или меньше он распознается: СНИЛС, ВУ, айдишки всякие и многое другое, это вопрос софта. Но вот если размер документа больше, то тут уже ничего не гарантируем, хотя свидетельства о рождении исхитрились и сделали, но только потому, что повезло и все данные свидетельства расположены аккурат на площади паспорта. В рамках развития самого сканера мы ищем экономически оправданный способ снижения его высоты, как найдем будет версия 3.0 (2.0 это пластиковая).

Ответить
0

А если документ будет «вручную» продвигаться?

Ответить
1

Сейчас в софте такая опция отсутствует, хотя сама технология склейки одного изображения из видео (а в сканере видеокамера) у нас есть и мы ее пытались использовать - не зашло. Оказалось не удобно, не быстро, не интуитивно, в общем получилась куча "не" и пара научных статей) Мы не теряем надежды придумать как это сделать удобно.

Ответить
1

По работе (скан личных документов) использую любой софт-сканер на iOS и Android, условный FineScanner.
А тут положил паспорт - и данные уже в твоей системе, просто и практично.
Молодцы!

Ответить
1

Совсем недавно мечтал о таком устройстве на таможне совместить со сканером лиц и убрать эти вечные очереди заменив пограничников софтом

Ответить
1

Ребята молодцы, но вот касательно «светлого будущего», лично я не вижу в будущем бумажных паспортов)

Ответить
1

Dbrain, который нынче Hendle, стартап из Белорусии, который прошёл недавно YC что-то похожее делает, только без железа 

Ответить
1

Так вот кто у меня с утра до вечера сверлит

Ответить
1

Спасибо за историю.

Ответить
0

"Ваш прибор — это просто камера в ящике. Что тут хитрого?

Просчитанная оптическая система сканера включает не только выбор модели камеры, но и подбор других элементов (подсветка, светоотражатели, рабочую поверхность), а также взаиморасположение всех перечисленных элементов."

Громкие слова и не более. Вы действительно запихали камеру в коробку с подсветкой. Там ну на самом деле есть нюансы, но блин, понтов-то!

Ответить
2

Просто и со вкусом, да. Допилили софт, сделали коробочку  и сэкономили тысячи человеко-часов людям 

Ответить
0

Было бы интересно узнать, кому продаете девайсы (вангую, что государству)

Ответить
1

Круг у нас широкий - проходные, регистратуры в больницах(частных), банки. В основной массе у заказчик коммерческий.

Ответить
0

О! Всегда хотел спросить:  а что вы делаете в случае неполного распознавания? 
Бывает же что текст пропечатывают чуть ниже чем надо, он сливается с горизонтальными линиями и дает артефакты.
Или например многие ламинируют разворот с данными, пластик дает блики и засветку.
При этом сам результат OCR у вас должен близок к максимальному, поэтому все артефакты дадут неверные символы в тексте - какой-нибудь BI вмест Ы, 8 вместо 0 и подобное.

С учетом что у вас уже аппаратный комплекс для быстрого ввода - нет страха что будет слишком много ошибок, причем таких которые оператор может легко пропустить?

Сорян за негатив, просто тоже подобным проектом занимался.

Ответить
0

В системе есть модуль самоконтроля, который дает сигнал в случае обнаружения различных артефактов на изображении или в ответе других подсистем. Т.е. ответ может быть помечен как хороший, сомнительный или плохой. В автоматических сканерах мы подаем специальный звуковой сигнал оператору который говорит - надо проверить.

Оптическая система сканера построена так, что не дает бликов, в этом и была одна из сложностей проектирования. Если говорить о смартфонах мы используем видеопоток и интеграцию результатов. 

Ответить
1

А что если не секрет делаете с иностранными паспортами, которые не на латинице? Где умляуты всякие?

Ответить
1

Мы умеем распознавать 613 знаков разных алфавитов, а также японские (хирагана, катакана, кандзи), корейские (хангыль) и китайские (классический) иероглифы. Картинка со знаками:

Ответить
0

Про китайский не очень понял - там только в упрощенной версии 8к иероглифов:
The new Table of General Standard Chinese Characters consisting of 8,105 (simplified and unchanged) characters was officially implemented for use by the State Council of the People's Republic of China on June 5, 2013.

Ответить
2

Мы поддерживаем распознавание 20 941 китайских иероглифов. В корейском 11 172, японском 12 912 + хирагана и катакана. На картинку разумных размеров это не лезет.
Полные спеки https://smartengines.ru/smart-idreader/

Ответить
0

Расскажите, пожалуйста, про "мы искали команду". Получилось ли найти команду целиком, как? Или набирали и обучали по одному?

Ответить
0

Нашли среди знакомых и научили.

Ответить

Прямой эфир