Для работы нейронной сети требуются “размеченные” данные. Как правило, чем больше объем данных и выше разнообразие анализируемого объекта, тем выше качество алгоритма, т.е. чтобы алгоритм нейронной сети понимал, какая заявка перед ним, он должен понимать какие позиции могут быть представлены в заявке, чтобы отнести ее к категории. Разметка и подготовка данных – всегда очень трудоемкий процесс: позиция в заявке - это строчка с N-ым количеством слов, в строительной отрасли много терминов, и нейросеть должна определять и правильно относить их к категории. При этом важно понимать, что нейросети нужные четкие входные данные и, например, заявка, заполненная с ошибками или состоящая из аббревиатур, может быть обработана некорректно, но это уже задачи нейролингвистического анализа (NLP).