VALIDATE: как мы учим искусственный интеллект понимать документы
Проверка документов — один из самых скучных, но критически важных процессов для бизнеса и госструктур. Банки, фонды, HR-отделы тратят часы на то, чтобы убедиться: в заявке есть все подписи, даты совпадают, а доверенности — действительные.
Команда СловоСофт создает систему VALIDATE — ИИ-инструмент, который автоматизирует формальную проверку документов и помогает экспертам работать в пять раз быстрее. Мы поговорили с разработчиками, которые создают «мозги» и «нервы» системы, о том, как устроен гибридный интеллект, с какими проблемами пришлось столкнуться и почему в AI важна человеческая логика.
«Сначала было сложно — текст порой невозможно было распознать даже глазом. Я занималась предобработкой изображений и нейронкой для распознавания печатей и подписей, встроенной в общий конвейер Validate.»
Идея VALIDATE родилась из желания сократить человеческий труд при формальной проверке документов. Эксперты тратили огромное количество времени на однотипные операции: сверку дат, ИНН, полномочий, сроков действия доверенностей. Validate стал «вторыми глазами» проверяющего — помощником, а не заменой.
«Сначала я писала скрипты для извлечения данных из заявок. Конвейер запускает их по очереди, обрабатывая каждый текст согласно схеме.»
Гибридный интеллект сочетает логические правила и нейросетевые методы. Нейросети распознают текст и выделяют сущности, логический слой проверяет соответствие формальным критериям — так, как это сделал бы эксперт.
«Конвейер логичный, система ведёт себя ожидаемо, ошибки фиксируем через логирование, это помогает быстро их исправлять.»
Обучение моделей — один из самых трудоёмких этапов. Команда создаёт собственные наборы данных, чтобы AI понимал контекст: различал подписи физлиц и представителей компаний.
«Подготовка датасетов была критически важна. Первые нейронки не справлялись, но последняя показала почти идеальный результат.»
Несмотря на автоматизацию, человек остаётся в центре системы. Validate помогает эксперту сосредоточиться на важных задачах, снижает рутину и повышает точность.
«AI помогает человеку, не заменяя его, фильтрует и корректирует данные, чтобы результат был надёжным.»
«Человеческая проверка гарантирует, что итог соответствует ТЗ и здравому смыслу.»
Сейчас VALIDATE тестируется, но уже показывает впечатляющие результаты: ускорение проверки документов в 5 раз и точность почти 99%. Команда расширяет возможности системы, интегрируя её с новыми инструментами и обучая для специализированных задач.
«Если представить Validate как живое существо, это спокойный, внимательный помощник, который делает своё дело шаг за шагом.»