{"id":14271,"url":"\/distributions\/14271\/click?bit=1&hash=51917511656265921c5b13ff3eb9d4e048e0aaeb67fc3977400bb43652cdbd32","title":"\u0420\u0435\u0434\u0430\u043a\u0442\u043e\u0440 \u043d\u0430\u0442\u0438\u0432\u043e\u043a \u0438 \u0441\u043f\u0435\u0446\u043f\u0440\u043e\u0435\u043a\u0442\u043e\u0432 \u0432 vc.ru \u2014 \u043d\u0430\u0439\u0434\u0438\u0441\u044c!","buttonText":"","imageUuid":""}

«Тинькофф» запустила бесплатный сервис для «расшифровки» чеков Статьи редакции

Сервис поможет бизнесу составить статистику и прогноз метрик продаж по клиенту, рассчитывают в компании.

«Тинькофф» запустила сервис для бизнеса для обработки текстовой информации из чеков ReceiptNLP, сообщил vc.ru представитель компании.

Сервис может найти в тексте название бренда, определить категорию товара, расшифровать сокращённое название и распознать продукт. Например, если в чеке написано «Бонаква 0,5», то сервис определит, что это вода, а сокращение «сиб кол пельм» — это пельмени «Сибирская коллекция».

ReceiptNLP использует нейросети и «находится в постоянном развитии», уточнил представитель компании. Сервис поможет бизнесу составить статистику или прогноз продаж по каждому клиенту, оценить вероятность смены бренда или магазина. Кроме того, сервис пригодится компаниям, которые обещают пользователям кэшбек на определённый бренд, категорию или товар — ReceiptNLP поможет распознать в чеке нужные позиции.

Среди первых партнёров проекта — производитель касс и несколько ОФД, рассказали в компании. «Тинькофф» получает от партнёров обратную связь и дорабатывает сервис. «Получается общий рыночный стандарт — так всем удобнее», — объяснили в компании. Сама «Тинькофф» использовала сервис для исследований трат россиян в магазинах.

«На основе ReceiptNLP мы дальше будем делать сервисы-алгоритмы, показывающие магазину и бренду, где он теряет в продажах и какие товары и промо нужно предлагать клиенту», — добавил представитель «Тинькофф».

0
33 комментария
Написать комментарий...
Ярослав Моисеев

Интересно как это реализовано технически? Я имею ввиду, в какой момент и каким устройством производится считывание чека. И зачем магазинам эта информация, разве у них нет статистики по продажам позиций, не понятно...

Ответить
Развернуть ветку
Алексей Щербаков

Мне кажется, это попытка нормализовать номенклатуру. Если посмотреть как пишут в разных сетях/магазинах, то там тот еще зоопарк. Поэтому вспоминая недавнюю новость от одного из ОФД, что предоставляют анализ по рынку, то без подобной нормализации тяжело его провести.

Ответить
Развернуть ветку
Aleksandr Gurov

Это большая проблема для российского ритейла в целом. Сейчас нет общепринятой структуры категорий товаров. Не говоря о том, чтобы классифицировать конкретные SKU. Мы проводим дискуссии с ритейлом по этому вопросу.

Ответить
Развернуть ветку
Вася Пражкин

Я так понимаю, дискуссия с ритейлом проходят примерно так:
- Дяденька из Ленты, давайте формализуем названия категорий и товарных позиций.
- Уйди мальчик, не до тебя сейчас.

Ответить
Развернуть ветку
Michael Smith

Ну поговорили же

Ответить
Развернуть ветку
Aleksandr Gurov

Ритейлеры заинтересованы в читаемом написании, поскольку мы для них дополнительная точка контакта с покупателем. Ритейлеры через нас делают коммуникацию промо , например, cash back на фрукты и овощи, чтобы расширить число категорий покупателя и увеличить РТО

Ответить
Развернуть ветку
Ярослав Моисеев

Понял, звучит логично)

Ответить
Развернуть ветку
Aleksandr Gurov

Наши клиенты получают кассовые чеки в МБ Тинькофф. Эти чеки полностью соответствуют 54-ФЗ. Например, наш клиент может вернуть товар в магазине, если покажет чек с нашего приложения.

Таким образом, у нас достаточно чеков, чтобы производить их обработку с помощью машинного обучения.

Ответить
Развернуть ветку
Тимофей Иванов

nlp возможно намекает на natural language processing. обычно там нейросеть используют

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Denis Denis

У них большая база чеков по их карточкам.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Aleksandr Gurov

Также выжно, чтобы это была реальная строчка из чека. А не придуманный пример из головы. 
Чем крупнее сеть, где вы получили чек — тем лучше мы его распознаем. Чем известнее производитель — тем лучше мы его определим.

Ответить
Развернуть ветку
Николай Белоусов

Сервис-угадайка получается

Ответить
Развернуть ветку
Alexey Sokolov

ОФД уже получают данные в электронном виде, при этом понятия не имеют о том, что скрывается под наименованиями, которые указываются в различных вариациях. У одних магазинов одни названия и сокращения, у других - другие. В итоге на один товар с легкостью получаются сотни вариантов. 
Мы решали задачу для одного из крупных ОФД по приведению названия из чека к каноническому виду, а так же отнесение к одной из 3 тыс. категорий еще 2,5 года назад. В основе так же лежал NLP.

Ответить
Развернуть ветку
Анон Плиз

Как обычно с бесплатным сыром будет? Работайте бета-тестерами бесплатно, а когда сетка обучится и сторонние продукты будут по самые помидоры завязаны на ней - включат счетчик

Ответить
Развернуть ветку
Nik Luchnikov

Не проще ли считывать номенклатуру из QR кода?

Ответить
Развернуть ветку
Владислав Прищепов

Ну такое.
Проверил сложные для восприятия человеком строки из реальных чеков - магии не случилось.

Ответить
Развернуть ветку
Mark Rapida Gromov

а реальные расшифровки есть?

Ответить
Развернуть ветку
Сергей Лебедев

Ну второй чек это Чоко Пай, скорее всего

Ответить
Развернуть ветку
Konstantin

Первый: "Фрекен Бок", пакет для мусора с затяжкой, синий.

По второму согласен с Сергеем, но заметьте - бренд какой-то "оранж" вместо "Орион")

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Aleksandr Gurov

С помощью регулярки не распознаешь, что в строчке из чека «Бонаква 0,5», товар — вода. Это как один из примеров, зачем использовали NLP.

Ответить
Развернуть ветку
алекс с

Много же магазинов, сотни тысяч

Ответить
Развернуть ветку
Mihael Isaev

И делается это для того, чтобы составить портрет всех и каждого для каких-то нехороших целей в будущем

Ответить
Развернуть ветку
Sergei Timofeyev

А толку? ОФД запрещено предоставлять информацию по позициям в чеке. Только сумму и категорию.

Ответить
Развернуть ветку
Nik Luchnikov

То есть наименование продукта не передается по вашему?

Ответить
Развернуть ветку
Sergei Timofeyev

Не знаю, но закон запрещает это отдавать. 

Ответить
Развернуть ветку
Анна Каренина

А json можно преобразовать в читабельный вид в этом сервисе? А то номенклатура в джейсоне, а налоговая этот формат не понимает

Ответить
Развернуть ветку
Aleksandr Gurov

Напишите, пожалуйста, удобный формат на [email protected]

Ответить
Развернуть ветку
Alexey Trofimov

Интересно. Как разметку делали?

Ответить
Развернуть ветку
Мария Андреева

Я приложением Чекгуру для анализа расходов пользуюсь, там товары из чеков распределяются по категориям и подкатегориям как-то автоматически. Но тоже не всегда в нужную категорию попадают.

Ответить
Развернуть ветку
Роман Поликов

Кхм, результат применения обычного word2vec на данных о совместной встречаемости товаров в чеках, далее с классификацией (k-means или аналогичной) по доступному всем каталогу товаров GS-1. Неужели все ОФД в РФ настолько деревянные, что не могут это сделать сами и готовы отдавать свои чеки в Тинькофф за бесплатно?

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
30 комментариев
Раскрывать всегда