SL Soft

@sl-soft
+342
с 2023

Разработчик российских бизнес-приложений

61 подписчик
0 подписок

Да, часто работники действительно рассматривают ЧОП как временную работу, однако крупные клиенты — сети магазинов — не должны брать на себя подобные риски. Именно поэтому мы разрабатываем решения, которые помогают контролировать качество работы сотрудников.

Спасибо, мы рады, что вам понравился материал!

1. Весь процесс можно поделить на два этапа: интеграцию IDP с системой компании и настройку самой нейронной модели.
Интеграция может занять от 20 минут до нескольких часов.
Настройка же сильно зависит от того, какие материалы будут обрабатываться. Как правило, самое длительное в этом процессе — разметка документов для обучения нейронных сетей. Это требуется, если вендор не поставляет готовое решение или у вас совсем непопулярный тип материалов. Условно документы можно поделить на три типа сложности для разметки: простые, средние и сложные.
1) К первым относится извлечение до 3 атрибутов из документа с четкой и постоянной структурой с 2 текстовыми строками и таблицей с 2 столбцами. На разметку в этом случае может уйти 1-3 дня, в зависимости от размера датасета (рекомендуется от 100 примеров на каждый тип документа).
2) Ко вторым можно отнести извлечение от 3 до 6 атрибутов из документа с четкой и постоянной структурой, где содержится до 5 текстовых строк и таблица с 3-5 столбцами. Здесь на разметку может уйти 4-7 дней, в зависимости от размера датасета (рекомендуется от 100 примеров на каждый тип документа).
3) Ну а к третьему типу относится все, что не попало к первому и второму. Сюда можно отнести и первые два вида, если качество документа низкое и придется применять различные донастройки, а возможно, даже доработки решения для приемлемого качества распознавания. Разметка здесь занимает от 7 дней.
Обучение нейронной сети длится недолго — от 15 минут до нескольких дней, в случае если загружается очень большой датасет.
Учитывая эти нюансы, полная интеграция состоит из:
— Внедрения решения в контур.
— Разметки датасета, если вендор не предлагает готовый продукт.
— Обучение нейронной сети.
Посчитать сроки можно, исходя из примерных оценок выше.

2. Как правило, партнерами вендора просто так не становятся. Прежде чем предложить услуги интегратора, компания-разработчик изучает задачу клиента и предлагает только подходящего партнера. Если же таких кандидатов на сотрудничество несколько, то обратить внимание стоит на количество реализованных проектов и уровень экспертизы интегратора именно в этом направлении.

3. Переход на платные IDP-решения лучше осуществлять в нескольких случаях:
• Когда использование платных сервисов в перспективе (длительность определяете для себя сами) выходит дешевле, чем трата ценного времени сотрудника на оцифровку документов.
• Если вы понимаете, что сотрудник, занимающийся оцифровкой документов, принесет гораздо больше денег в другом направлении, даже если покупка IDP в моменте кажется дорогой.
• Бесплатное решение не покрывает требуемый уровень безопасности.
• Не хватает индивидуального подхода к решению задачи.
• Инструментов бесплатных сервисов недостаточно для решения задачи.

4. Внедрить всегда можно. Уровень организации на это не влияет. Все зависит от стратегии, бюджета и задач. И очень часто бюджет — ключевой фактор при принятии решения. Всегда нужно обращать внимание на целесообразность использования той или иной технологии.
Иногда маленькие вендоры ищут маленьких клиентов, чтобы расти вместе. И этот тандем будет выгоден обоим.

1

1. Пользователю не нужно самостоятельно искать и извлекать необходимые данные после распознавания, так как IDP выдает сразу нужный результат, за счет этого и повышается скорость обработки. А если настроить взаимодействие IDP с системой компании, то информация будет попадать в нее автоматически. Изредка нужна лишь валидация готовых данных. Умной технологию называют из-за того, что она умеет анализировать распознанные данные и выдает только требуемую пользователю информацию.

2. Задачу по обучению моделей может взять на себя вендор, у которого и приобретена технология; партнеры вендора, имеющие право на проведение таких работ; различные интеграторы или фрилансер. Но с последним вариантом надо быть осторожнее: необходимо понимать, какие данные будут обрабатываться таким специалистом. Иногда спасает NDA.

3. Для начала необходимо определить, какие документы и сущности будут обрабатываться. Далее:
– Если в материалах нет коммерческой тайны или персональных данных, то можно обратиться к бесплатным сервисам и библиотекам. Их много, поэтому нужно отталкиваться от задачи и объемов, проводить тесты на собственных документах. Постепенно можно переводить на IDP все больше и больше типов материалов.
– Если в документах есть чувствительные данные и систему можно использовать только в закрытом контуре, то советуем поискать, какие вендоры предлагают такую технологию, и обратиться к ним за демолицензией или провести пилотный запуск. На этом этапе можно оценить, насколько затраты на эту технологию оправданы именно в вашей организации. Но сразу стоит обратить внимание на то, что, если объемы распознаваемых документов небольшие, продукты будут стоить дороже. К примеру, маленьким можно считать все, что составляет менее 10 000-15 000 страниц для распознавания.

1

Здравствуйте!
Есть, в качестве примера – проект с городским департаментом транспорта: оцифровка архивных документов и создание единой системы хранения с обеспечением семантического поиска.
Выполнена ретроконверсия имеющегося бумажного архивного фонда (форматов от А0 до А4), полученные электронные образы атрибутированы и загружены в единую систему хранения архивных документов.
Разработана единая система хранения архивных документов, в т.ч. вновь поступающих из оперативных систем, обеспечен интеллектуальный семантический поиск по всему массиву архивных данных
В итоге:
- Создана единая точка хранения документов с учетом прав доступа;
- Повышены скорость и гибкость поиска документов по запросам;
- Упрощены доступ к документам архивного фонда и получение копий для использования в работе;
- Сократились сроки приема-передачи документов на архивное хранение от подразделений.

Если у вас будут еще вопросы – пишите, постараемся на все ответить!

Нерегламентированную рутинную работу не получится отдать роботу, задачи с творческой составляющей робот тоже не сможет решить — здесь все же придется отдуваться самим.

1

Это классический вопрос, каким способом автоматизировать задачу: дорабатывать систему, интегрировать системы по API или настроить робота. В каждом конкретном случае клиенты принимают решение самостоятельно, исходя из ситуации. Привели ниже несколько примеров, когда роботы — правильный выбор:
— Отсутствует возможность интеграции по API (у имеющихся систем либо нет API, либо любые интеграции запрещены, либо длительные согласования). Роботы же работают без API и не меняют ИТ-ландшафт.
— Недостаточно ресурсов на интеграцию по API . Не всегда есть бюджет на развитие и доработку всех систем, участвующих в процессе. У разных владельцев систем отличаются приоритеты по задачам, цели и бюджет. Для интеграции между системами требуются согласования и доработки с каждой из сторон. Роботы же могут быть использованы на системах "как они есть”.
— Автоматизация выполняется своими силами. Доработки системы зачастую производятся подрядчиками, договор и перечь работ уже могут быть согласованы. А если есть внутренняя экспертиза по роботизации, можно своими силами автоматизировать задачи без привлечения подрядчиков, проведения конкурсов и ожидания итогов.
— Бизнесу нужен быстрый результат. С помощью роботов задачи можно решить быстро, а интеграцию необходимо согласовывать с владельцами систем и архитекторами, что затягивает сроки выполнения.
— Бизнесу важна окупаемость. Интеграция на порядок дороже применения роботов, так как требует привлечения кадров, цена которых высока: разработчиков, архитекторов, DevOps-инженеров. Робот же настраивается аналитиком, который и собирает требования, и настраивает сценарий, и тестирует его. Поддержка тоже максимально проста и недорога.

Бесспорно, если задачи можно реализовать доработкой системы или автоматизацией через API и на это есть средства, время и персонал, мы предложим клиенту идти этим путем, но зачастую (по разным причинам) роботы оказываются самым оптимальным и рабочим вариантом.

вообще - большие: у "РЖД" есть ведь стратегия цифровой трансформации + они выделили в холдинге две, если не ошибаемся, ИТ-компании под эти цели.

Понимаем вас! :) но к нам, увы, с такой задачей не приходили...

возможно, не совсем правильный сценарий был продуман или словарный запас оказался недостаточным в тех случаях, которые вас расстроили.