{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Ozon: в расчет средней позиции аналитики заложен неверный алгоритм, поддержка проблему игнорирует

Пишу сюда, потому что мое обращение #14235191 было просто закрыто сотрудником Ozon в одностороннем порядке даже без возможности переоткрыть его и даже без возможности поставить оценку (вообще впервые такое вижу), что продемонстрировав отсутствие интереса решать проблему, которая не столько мешает лично мне, сколько позорит вашу организацию и, возможно, доставляет неудобство другим селлерам.

А теперь к сути:

У Ozon, как известно, есть чудесный инструмент - Аналитика, в котором как-то появилась далеко не самая бесполезная по своей идее метрика - средние позиции товара по запросу.

И все бы в этой фиче было бы хорошо, если не одно "но": реализацией таковой занимался программист, который, по всей видимости, в гробу видал свою работу и от вашего лица плевал на всех партнеров, которые будут данную метрику использовать.

Так что же с этой частью аналитики не так?

Когда только Ozon добавил информацию о средних позициях товара, я начал ее изучать и думать: как это можно применить на практике. И мне хватило буквально несколько минут, чтобы не просто найти противоречия в этих данных, но и понять: от-куда они взялись.

А взялись они из того, что кому-то было лень написать несколько "лишних" строк кода, дабы учесть в аналитике ситуацию, когда товар по тем или иным причинам просто не показывается, а значит и не может иметь данных о своих позициях.

Да, в этом плане данная метрика уникальная: ведь по всем остальным нужно уметь только складывать, а вот в учете позиций попахивает более сложными вычислениями, за которые сотрудникам Ozon, возможно, просто не доплачивают.

Абстрагируемся для того, чтобы ситуация была понятна всем:

Допустим, в школьных соревнованиях должно было участвовать 10 учеников. Из них семеро заболело, а оставшиеся трое заняли 1, 2, 3 места соответственно.

Но какое место заняли ученики в среднем? Математика проста: складываем места, которые заняли ученики (1+2+3) и делим на общее количество участников, участвовавших в соревнованиях: на 3, получая 2, как среднее место.

А что с учениками, которые в соревнованиях не участвовали?

Очевидно, что их никак не "пришить" к расчету среднего места. От слова "совсем". Их просто нужно исключить из расчета. Это очевидно: НЕ участвовавшие в соревнованиях ученики не занимают никаких мест: ни первых, ни последних и нельзя их каким-то образом учитывать в итоговом отчете.

Конечно, если очень хочется все-таки учесть, то можно, например, поставив отсутствующих учеников на последние места - наверняка в каких-то соревнованиях так и поступают.

Но уж точно чего делать не стоит, так это ставить отсутствующих учеников на нулевые места, после чего без каких-либо угрызений совести пихать эти нули в итоговые расчеты.

Но сотрудник из Ozon именно так и поступает: присваивает товару место номер ноль, если он отсутствовал в показах, а потом без каких-либо проблем суммирует эти данные с остальными, деля их на общее число измерений.

Т.е. если бы этого сотрудника попросили предоставить отчет о школьных соревнованиях, то он бы посчитал так: (1+2+3+0*7)/10, заявив о том, что ученики заняли в среднем 0,6 место.

Еще бы интереснее был бы расчет среднего места ученика в разных соревнованиях:

В первом соревновании занял 10-е место, во втором не участвовал. Значит в среднем ученик занимает 5-е место. Здорово, правда?

Я уже молчу про то, что если наш условный сотрудник Ozon без всякого зазрения совести будет складывать и делить места для разных дисциплин вместе: например, соревнования по бегу и контрольные по литературе.

Места в категориях - в кучу, в поиске - в кучу. Запросы по рейтингу, популярности, по цене - все-все кидаем в одну кучу. И даже если это сам селлер искал свой товар по SKU - да тоже в кучу все закинем и на все поделим.

Чего заморачиваться, верно? Пусть "уважаемые партнеры" сами разбираются!

Спасибо за внимание!

P.S. Я не просто так столь детально описал данную проблему. Подобных экстравагантных решений у Ozon хватает (я сейчас именно про раздел аналитики). И причина вовсе не в каких-то ошибках или в неопытности сотрудников, а именно в наплевательском отношении к своей работе. Или же в преступной глупости - допускаю и такой вариант.

0
57 комментариев
Написать комментарий...
Vladimir Goncharov
Очевидно, что их никак не "пришить" к расчету среднего места

Это с какого перепуга взято ? Товар показывается с 0 кол-вом показов, портит вашу метрику, все верно.

наплевательском отношении к своей работе

Нет, просто кто-то даже "Статистику на котиках" не прочел, но свое мнение имеет.
Описание статистических парадоксов тоже феерическое, конечно. И разумеется, все это не спроста - ЗАГОВОР!

Ответить
Развернуть ветку
Andrey Shevtsov
Автор
Это с какого перепуга взято ? Товар показывается с 0 кол-вом показов, портит вашу метрику, все верно.

Кто-то, как я понимаю, даже прочел. Но ума ему это не добавило. При чем тут показы вообще, прошу прощения?

Ответить
Развернуть ветку
631 052

ну вот просто человек убежден, что если показов ноль, то и место товара в списке - нулевое (т.е. даже выше, чем чемпионское - первое).

почему он так решил, вопрос другой.
воскресенье, утро, мало ли

Ответить
Развернуть ветку
Vladimir Goncharov

Писатель статьи путает место в выдаче и частоту появления на этом месте. Если товар за период показывался 1 раз из ста на 1 месте, 10 раз из ста на 5 месте и оставшиеся 89 запросов не показывался - очевидно, что место у него будет на дне, а не наверху. Наверху будет как раз, если нули откинуть

Ответить
Развернуть ветку
Александр Богданов

Так автор говорит о том, что этим 89 запросам присваивается значение 0, нет?

Ответить
Развернуть ветку
631 052

именно. и среднее взлетает вверх.

Ответить
Развернуть ветку
Andrey Shevtsov
Автор

Проблема даже не в этом, ведь подобные данные можно действительно отсечь. Правда, не таким примитивным методом, как предлагает комментатор выше со своей мурзилкой, а разложив значения на линии, где для позиций в рамках одной категории и в один день будет соответствовать статистическому правилу: чем выше место - тем больше должно быть показов. Таким образом можно отсечь не валидные данные. Реальная проблема возникает в ситуациях, когда товар был продан и новые из измерения за этот же день дают нули, усредняя значение. Например, одно измерение - 100, второе - 0, в среднем - 50. Но мы не знаешь цифры из которых складывалось число и сколько было измерений, а значит не можем без дополнительной валидация доверять этим данным вообще. Но наш мурзилкин дальше своих картинок с котиками не ушёл. Советую быть осторожнее с ним - вдруг это заразно.

Ответить
Развернуть ветку
631 052

так разумеется, поместил в игнор.

Ответить
Развернуть ветку
54 комментария
Раскрывать всегда