{"id":9130,"title":"\u0417\u0430\u0449\u0438\u0442\u0438\u0442\u044c \u0440\u0430\u0431\u043e\u0447\u0438\u0435 \u043a\u043e\u043c\u043f\u044c\u044e\u0442\u0435\u0440\u044b \u0438 \u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043c\u0435\u043d\u044c\u0448\u0435 \u043d\u0430 \u0442\u0435\u0445\u043f\u043e\u0434\u0434\u0435\u0440\u0436\u043a\u0443","url":"\/redirect?component=advertising&id=9130&url=https:\/\/vc.ru\/promo\/305439-reshenie-dlya-biznesa-zashchitit-rabochie-kompyutery-i-tratit-menshe-na-tehpodderzhku&placeBit=1&hash=85c54b2e13f250dedc65edea594d27f2b8d3772b0cf075b87dc84abeac949895","isPaidAndBannersEnabled":false}

«Тинькофф» запустила бесплатный сервис для «расшифровки» чеков Статьи редакции

Сервис поможет бизнесу составить статистику и прогноз метрик продаж по клиенту, рассчитывают в компании.

«Тинькофф» запустила сервис для бизнеса для обработки текстовой информации из чеков ReceiptNLP, сообщил vc.ru представитель компании.

Сервис может найти в тексте название бренда, определить категорию товара, расшифровать сокращённое название и распознать продукт. Например, если в чеке написано «Бонаква 0,5», то сервис определит, что это вода, а сокращение «сиб кол пельм» — это пельмени «Сибирская коллекция».

ReceiptNLP использует нейросети и «находится в постоянном развитии», уточнил представитель компании. Сервис поможет бизнесу составить статистику или прогноз продаж по каждому клиенту, оценить вероятность смены бренда или магазина. Кроме того, сервис пригодится компаниям, которые обещают пользователям кэшбек на определённый бренд, категорию или товар — ReceiptNLP поможет распознать в чеке нужные позиции.

Среди первых партнёров проекта — производитель касс и несколько ОФД, рассказали в компании. «Тинькофф» получает от партнёров обратную связь и дорабатывает сервис. «Получается общий рыночный стандарт — так всем удобнее», — объяснили в компании. Сама «Тинькофф» использовала сервис для исследований трат россиян в магазинах.

«На основе ReceiptNLP мы дальше будем делать сервисы-алгоритмы, показывающие магазину и бренду, где он теряет в продажах и какие товары и промо нужно предлагать клиенту», — добавил представитель «Тинькофф».

0
33 комментария
Популярные
По порядку
Написать комментарий...

Интересно как это реализовано технически? Я имею ввиду, в какой момент и каким устройством производится считывание чека. И зачем магазинам эта информация, разве у них нет статистики по продажам позиций, не понятно...

7

Мне кажется, это попытка нормализовать номенклатуру. Если посмотреть как пишут в разных сетях/магазинах, то там тот еще зоопарк. Поэтому вспоминая недавнюю новость от одного из ОФД, что предоставляют анализ по рынку, то без подобной нормализации тяжело его провести.

3

Это большая проблема для российского ритейла в целом. Сейчас нет общепринятой структуры категорий товаров. Не говоря о том, чтобы классифицировать конкретные SKU. Мы проводим дискуссии с ритейлом по этому вопросу.

7

Я так понимаю, дискуссия с ритейлом проходят примерно так:
- Дяденька из Ленты, давайте формализуем названия категорий и товарных позиций.
- Уйди мальчик, не до тебя сейчас.

16

Ну поговорили же

0

Ритейлеры заинтересованы в читаемом написании, поскольку мы для них дополнительная точка контакта с покупателем. Ритейлеры через нас делают коммуникацию промо , например, cash back на фрукты и овощи, чтобы расширить число категорий покупателя и увеличить РТО

0

Понял, звучит логично)

0

Наши клиенты получают кассовые чеки в МБ Тинькофф. Эти чеки полностью соответствуют 54-ФЗ. Например, наш клиент может вернуть товар в магазине, если покажет чек с нашего приложения.

Таким образом, у нас достаточно чеков, чтобы производить их обработку с помощью машинного обучения.

5

nlp возможно намекает на natural language processing. обычно там нейросеть используют

1

Я бы реализовывал, как получение данных от ОФД через сканирование куара + реквизитов вокруг него + дополнение распознанием текста 

0

У них большая база чеков по их карточкам.

0

чисто от балды, но мне кажется, что с большей вероятностью я бы с таким наименованием купил царские сырки, нежели бюст

3

Также выжно, чтобы это была реальная строчка из чека. А не придуманный пример из головы. 
Чем крупнее сеть, где вы получили чек — тем лучше мы его распознаем. Чем известнее производитель — тем лучше мы его определим.

6

Сервис-угадайка получается

1

ОФД уже получают данные в электронном виде, при этом понятия не имеют о том, что скрывается под наименованиями, которые указываются в различных вариациях. У одних магазинов одни названия и сокращения, у других - другие. В итоге на один товар с легкостью получаются сотни вариантов. 
Мы решали задачу для одного из крупных ОФД по приведению названия из чека к каноническому виду, а так же отнесение к одной из 3 тыс. категорий еще 2,5 года назад. В основе так же лежал NLP.

4

Как обычно с бесплатным сыром будет? Работайте бета-тестерами бесплатно, а когда сетка обучится и сторонние продукты будут по самые помидоры завязаны на ней - включат счетчик

4

Не проще ли считывать номенклатуру из QR кода?

3

Ну такое.
Проверил сложные для восприятия человеком строки из реальных чеков - магии не случилось.

1

а реальные расшифровки есть?

2

Ну второй чек это Чоко Пай, скорее всего

4

Первый: "Фрекен Бок", пакет для мусора с затяжкой, синий.

По второму согласен с Сергеем, но заметьте - бренд какой-то "оранж" вместо "Орион")

3

Выглядят как хреново написанные регулярки. Зачем тут им NLP ума не приложу. Уж легче номенклатурную базу поддерживать в ручном режиме. Магазинные базы не часто меняются.

0

С помощью регулярки не распознаешь, что в строчке из чека «Бонаква 0,5», товар — вода. Это как один из примеров, зачем использовали NLP.

1

Много же магазинов, сотни тысяч

0

И делается это для того, чтобы составить портрет всех и каждого для каких-то нехороших целей в будущем

1

А толку? ОФД запрещено предоставлять информацию по позициям в чеке. Только сумму и категорию.

–1

То есть наименование продукта не передается по вашему?

1

Не знаю, но закон запрещает это отдавать. 

0

А json можно преобразовать в читабельный вид в этом сервисе? А то номенклатура в джейсоне, а налоговая этот формат не понимает

0

Напишите, пожалуйста, удобный формат на receipt@tinkoff.ru

0

Интересно. Как разметку делали?

0

Я приложением Чекгуру для анализа расходов пользуюсь, там товары из чеков распределяются по категориям и подкатегориям как-то автоматически. Но тоже не всегда в нужную категорию попадают.

0

Кхм, результат применения обычного word2vec на данных о совместной встречаемости товаров в чеках, далее с классификацией (k-means или аналогичной) по доступному всем каталогу товаров GS-1. Неужели все ОФД в РФ настолько деревянные, что не могут это сделать сами и готовы отдавать свои чеки в Тинькофф за бесплатно?

0

Комментарий удален

Читать все 33 комментария
Лайфхак в подборе: как ATS-системы помогают экономить время и бюджет рекрутеров

Процесс рекрутинга существенно не отличается от компании к компании. Есть несколько типичных шагов, которые проходит рекрутер: размещение вакансии на джоб-бордах, поиск соискателей по базам, согласование кандидатов с заказчиками, собеседование, выдача и проверка тестового задания, проверка кандидата службой безопасности.

Минэкономразвития РФ приняло предложения РСПП по совершенствованию рынка интеллектуальной собственности

На актуализации плана дорожной карты ТДК (трансформация делового климата) «Интеллектуальная собственность» в соответствии с пожеланиями бизнес-сообщества настоял первый заместитель председателя правительства Андрей Белоусов.

Мвидео отказал в замене товара ненадлежащего качества. Битый телевизор

14.11.2021 доставка магазина Мвидео привезла мне домой телевизор LG. При приёме телевизора от доставщиков никаких недостатков не обнаружили ( или не заметили, потому что телевизор был весь запотевший). Включать для проверки тоже не стали из-за запотевания. В тот же вечер через несколько часов телевизор повесили и попытались включить, он не…

На сайтах с эквайрингом от ПСБ появился Yandex Pay

Покупатели с аккаунтом «Яндекса» смогут оплачивать покупки, не вводя данные карты.

Kornia - Python библиотека для обработки изображений в задачах CV

В этой статье я хотел бы познакомить читателей с библиотекой для ЯП python — Kornia, имеющей богатый функционал в области computer vision. Библиотека написана с использованием pytorch, в ее основе лежат готовые решения, такие как torchvision, PIL, skimage, tf.image, OpenCV. В Kornia реализована возможность выполнения вычислений не только с…

Это Элви Рэй Смит: он мечтал создать анимационный фильм на компьютере, соосновал Pixar, но ушёл из компании из-за Джобса Статьи редакции

Смит создал альфа-канал, который используется в Photoshop и других редакторах, работал в Xerox и LucasFilm и убеждал всех, что за компьютерной графикой будущее, однако всерьез его никто не воспринимал – кроме Стива Джобса.

«Мегафон» заблокировал 36 тыс. ₽ на 2 недели по ФЗ № 115

Являюсь абонентом Мегафона второй десяток лет. Несколько лет назад завёл себе карту Мегафон-банка. Очень нравилось, и рекомендовал всем, так как:

Эксперимент: оформляем банковские карты без бумажных документов

Оформление затянулось, но проект все равно продолжили развивать.

Мвидео, облажались. Дважды

#жалобамвидео или как продать витринный образец

null