С помощью регулярки не распознаешь, что в строчке из чека «Бонаква 0,5», товар — вода. Это как один из примеров, зачем использовали NLP.
Напишите, пожалуйста, удобный формат на receipt@tinkoff.ru
Также выжно, чтобы это была реальная строчка из чека. А не придуманный пример из головы.
Чем крупнее сеть, где вы получили чек — тем лучше мы его распознаем. Чем известнее производитель — тем лучше мы его определим.
Это большая проблема для российского ритейла в целом. Сейчас нет общепринятой структуры категорий товаров. Не говоря о том, чтобы классифицировать конкретные SKU. Мы проводим дискуссии с ритейлом по этому вопросу.
Наши клиенты получают кассовые чеки в МБ Тинькофф. Эти чеки полностью соответствуют 54-ФЗ. Например, наш клиент может вернуть товар в магазине, если покажет чек с нашего приложения.
Таким образом, у нас достаточно чеков, чтобы производить их обработку с помощью машинного обучения.
Ритейлеры заинтересованы в читаемом написании, поскольку мы для них дополнительная точка контакта с покупателем. Ритейлеры через нас делают коммуникацию промо , например, cash back на фрукты и овощи, чтобы расширить число категорий покупателя и увеличить РТО