Как ИИ ускорил оцифровку архивов машиностроительного холдинга в несколько раз
И снизил объем рутинных операций инженеров на 50-90%, освободив время сотрудников для создания конкурентных преимуществ бизнеса.
Цель: ускорить оцифровку архивов
Огромные объемы инженерных данных промышленных предприятий хранятся в бумажных архивах конструкторской и технологической документации. Отсутствие возможности воссоздать электронный состав или извлечь метаданные с чертежа замедляет процесс проектирования новой техники, усложняет ремонт и модернизацию существующей, создает угрозу потери знаний, ведет к репутационным рискам и прямым убыткам.
Производительность труда инженеров из-за недостаточной оцифровки документации сильно снижается. Согласно исследованию IDC, 42% рабочего времени сотрудников интеллектуального труда тратится на поиск, обработку и обмен информацией. Кроме того, примерно в 46% случаев специалисты не могут найти нужную информацию.
Оцифровка классическими способами также не является решением проблемы. Например, команда одного из клиентов Т1 – крупного машиностроительного холдинга – посчитала, что для выполнения этой задачи потребуется 10 лет непрерывной работы 10 сотрудников. Все дело в трудоемкости извлечения метаданных из конструкторской и технологической документации, которая была оформлена в бумажном виде без машиночитаемого текста, так же важно сформировать структурированное цифровое представление на основе извлеченных метаданных, для последующего импорта в учетные системы класса PLM/ERP с возможностью верификации номенклатурных позиций на актуальность и корректность.
Чтобы найти способ ускорить процесс, они обратились к Т1 ИИ.
Постановка задачи
Для достижения цели требовалось решение по обработке сканов конструкторской документации на базе искусственного интеллекта со следующим функционалом:
- распознавание рукописного и печатного текста;
- распознавание документов оформленных по ЕСКД/ЕСТД, умение выделять таблицы, подписи, условные обозначения;
- возможность анализа содержания документа;
- возможность настройки и непрерывной адаптации решения по разные форматы и содержание конструкторской документации;
- работа в закрытом внутреннем контуре для избежания риска утечек данных;
- возможность загрузки информации в PLM-систему (от англ. Product Lifecycle Management, корпоративная среда, которая управляет всем жизненным циклом изделия) для создания цифровой базы знаний.
Точность распознавания документов при этом должна быть не ниже 90%, чтобы сократить до минимума необходимость ручной проверки документов после работы ИИ.
Решение: ставка на ИИ
Команда Т1 ИИ предложила решение на базе мультимодальных моделей, способных анализировать и изображения, и текст.
В основе проекта лежит MLOps-платформа «Сайбокс», которая обеспечивает полный цикл обучения и развертывания ИИ-моделей в защищенном контуре заказчика. А для конкретной задачи расшифровки и анализа результатов использовался инструмент «Интеллектуальный анализ документов» (ИАД) – продукт, разработанный Т1 ИИ в том числе для автоматизации обработки технической документации.
Как работает система:
1. Сначала ИИ-модуль проводит потоковую обработку сканов конструкторских спецификаций, сборочных чертежей и извещений об изменениях.
2. Далее используются специализированные алгоритмы распознавания и сегментации в связке с адаптированными VLM моделями для распознавания рукописного и печатного текста. Алгоритмы позволяют извлечь метаданных даже из низкоконтрастных документов.
3. Затем модуль анализа метаданных выстраивает структуру изделия, которая доступна для последующего редактирования, модуль распознает таблицы, подписи и условные обозначения — в соответствии с требованиями ГОСТ/ОСТ. Модуль может использоваться для одиночной обработки документов или в потоковом режиме.
4. После этого система применяет технологии интеллектуального анализа данных . Она сопоставляет данные из разных документов, извлекая дополнительные атрибуты, проверяя на актуальность и корректность.
Для этого используется комбинация методов компьютерного зрения и обработки естественного языка, а также retrieval-подход, похожий на принцип RAG-моделей (Retrieval-Augmented Generation): ИИ не придумывает данные, а ищет и объединяет нужные фрагменты из внутренней базы инженерных документов и корпоративных стандартов предприятия, чтобы собрать полное и достоверное описание изделия, максимально сократив риск галлюцинаций.
5. Через интерфейс в АРМе Валидатора инженер проверяет результаты и при необходимости вносит правки. Так с каждой итерацией модель самообучается и повышает точность.
6. Файл форматируется в формат XML для загрузки в учетную систему предприятия (PDM/PLM/ERP). Уже поддерживаются форматы XML для загрузки в Лоцман и Teamcenter.
В результате получается замкнутая технологическая цепочка: от скана документа до экспорта готового XML-файла в систему предприятия.
Эффект от внедрения: цифры и факты
После запуска решение развернули на серверном оборудовании заказчика внутри защищенного контура. Т1 ИИ обеспечил методическое сопровождение и обучение специалистов холдинга.
Результаты:
- Снижение объема рутинных операций на 50–90%;
- Точность распознавания: более 90% (выше, чем при ручном распознании);
- Ускорение цифровизации архива в 3 раза.
Благодаря проекту компания получила не просто инструмент распознавания, а целую интеллектуальную фабрику данных: систему, которая превращает архивы документации в работающую цифровую базу знаний. Помимо прямой экономии это дало ощутимый эффект для бизнеса: инженеры перестали тратить время на ввод данных и сосредоточились на более творческих задачах, обслуживание техники стало происходить быстрее – архив теперь связан с цифровыми карточками изделий, снизились риски ошибок и простоев.
Этот кейс показывает, что ИИ в промышленности – уже не эксперимент, а инструмент сохранения инженерного опыта и повышения эффективности труда работников. И решения Т1 ИИ помогают превратить архив в источник данных для новых разработок, быстрого обслуживания и создания конкурентных преимуществ предприятия.