Ozon: в расчет средней позиции аналитики заложен неверный алгоритм, поддержка проблему игнорирует

Пишу сюда, потому что мое обращение #14235191 было просто закрыто сотрудником Ozon в одностороннем порядке даже без возможности переоткрыть его и даже без возможности поставить оценку (вообще впервые такое вижу), что продемонстрировав отсутствие интереса решать проблему, которая не столько мешает лично мне, сколько позорит вашу организацию и, возможно, доставляет неудобство другим селлерам.

А теперь к сути:

У Ozon, как известно, есть чудесный инструмент - Аналитика, в котором как-то появилась далеко не самая бесполезная по своей идее метрика - средние позиции товара по запросу.

И все бы в этой фиче было бы хорошо, если не одно "но": реализацией таковой занимался программист, который, по всей видимости, в гробу видал свою работу и от вашего лица плевал на всех партнеров, которые будут данную метрику использовать.

Так что же с этой частью аналитики не так?

Когда только Ozon добавил информацию о средних позициях товара, я начал ее изучать и думать: как это можно применить на практике. И мне хватило буквально несколько минут, чтобы не просто найти противоречия в этих данных, но и понять: от-куда они взялись.

А взялись они из того, что кому-то было лень написать несколько "лишних" строк кода, дабы учесть в аналитике ситуацию, когда товар по тем или иным причинам просто не показывается, а значит и не может иметь данных о своих позициях.

Да, в этом плане данная метрика уникальная: ведь по всем остальным нужно уметь только складывать, а вот в учете позиций попахивает более сложными вычислениями, за которые сотрудникам Ozon, возможно, просто не доплачивают.

Абстрагируемся для того, чтобы ситуация была понятна всем:

Допустим, в школьных соревнованиях должно было участвовать 10 учеников. Из них семеро заболело, а оставшиеся трое заняли 1, 2, 3 места соответственно.

Но какое место заняли ученики в среднем? Математика проста: складываем места, которые заняли ученики (1+2+3) и делим на общее количество участников, участвовавших в соревнованиях: на 3, получая 2, как среднее место.

А что с учениками, которые в соревнованиях не участвовали?

Очевидно, что их никак не "пришить" к расчету среднего места. От слова "совсем". Их просто нужно исключить из расчета. Это очевидно: НЕ участвовавшие в соревнованиях ученики не занимают никаких мест: ни первых, ни последних и нельзя их каким-то образом учитывать в итоговом отчете.

Конечно, если очень хочется все-таки учесть, то можно, например, поставив отсутствующих учеников на последние места - наверняка в каких-то соревнованиях так и поступают.

Но уж точно чего делать не стоит, так это ставить отсутствующих учеников на нулевые места, после чего без каких-либо угрызений совести пихать эти нули в итоговые расчеты.

Но сотрудник из Ozon именно так и поступает: присваивает товару место номер ноль, если он отсутствовал в показах, а потом без каких-либо проблем суммирует эти данные с остальными, деля их на общее число измерений.

Т.е. если бы этого сотрудника попросили предоставить отчет о школьных соревнованиях, то он бы посчитал так: (1+2+3+0*7)/10, заявив о том, что ученики заняли в среднем 0,6 место.

Еще бы интереснее был бы расчет среднего места ученика в разных соревнованиях:

В первом соревновании занял 10-е место, во втором не участвовал. Значит в среднем ученик занимает 5-е место. Здорово, правда?

Я уже молчу про то, что если наш условный сотрудник Ozon без всякого зазрения совести будет складывать и делить места для разных дисциплин вместе: например, соревнования по бегу и контрольные по литературе.

Места в категориях - в кучу, в поиске - в кучу. Запросы по рейтингу, популярности, по цене - все-все кидаем в одну кучу. И даже если это сам селлер искал свой товар по SKU - да тоже в кучу все закинем и на все поделим.

Чего заморачиваться, верно? Пусть "уважаемые партнеры" сами разбираются!

Спасибо за внимание!

P.S. Я не просто так столь детально описал данную проблему. Подобных экстравагантных решений у Ozon хватает (я сейчас именно про раздел аналитики). И причина вовсе не в каких-то ошибках или в неопытности сотрудников, а именно в наплевательском отношении к своей работе. Или же в преступной глупости - допускаю и такой вариант.

0
57 комментариев
Написать комментарий...
Vladimir Goncharov
Очевидно, что их никак не "пришить" к расчету среднего места

Это с какого перепуга взято ? Товар показывается с 0 кол-вом показов, портит вашу метрику, все верно.

наплевательском отношении к своей работе

Нет, просто кто-то даже "Статистику на котиках" не прочел, но свое мнение имеет.
Описание статистических парадоксов тоже феерическое, конечно. И разумеется, все это не спроста - ЗАГОВОР!

Ответить
Развернуть ветку
Andrey Shevtsov
Автор
Это с какого перепуга взято ? Товар показывается с 0 кол-вом показов, портит вашу метрику, все верно.

Кто-то, как я понимаю, даже прочел. Но ума ему это не добавило. При чем тут показы вообще, прошу прощения?

Ответить
Развернуть ветку
Vladimir Goncharov
При чем тут показы вообще

Это не ваши слова ?

дабы учесть в аналитике ситуацию, когда товар по тем или иным причинам просто не показывается

Дальше идет фальшивая аналогия с неким классом, где кто-то учавствует в неких соревнования, а кто-то нет. Товар всегда учавствует, пусть и с 0 показателями и это правила Ozon.
А исходя из статистики - почему из выборки предлагается выкидывать товары с неким малым/нулевым количеством показов, а не все выбросы ?
Для правильного среднего (как написано в книжках, да, а не свой сок мозга) надо выкидывать как нижние выбросы, так и верхние. Т.е. узнать такое интересное и захватывающее понятие как КВАРТИЛЬ, а не вот это все про классы, учеников, места какие-то. Но я так понимаю, введение такого понятия в отчетность приведет к очередному расследованию ТАЙН И ЗАГОВОРОВ, это ж надо будет всякие рассеивания понимать. А сколько можно на парадоксах статистики "примеров" напечь, ммм.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Vladimir Goncharov
более простым языком и прогнал про те самые квартили
Очевидно, что их никак не "пришить" к расчету среднего места. От слова "совсем"

Конечно же пришить, среднее арифметическое так и считается.

прогнал про те самые квартили

Усеченное среднее берется не только снизу, но ему пока печет только от нулей. Самое забавное, что как только ему сделают нули, он поймет что выбросы сверху тоже дерьмо и не должны попадать в выборку, но таких невероятных слов автору знать не гоже, он математике бежит учить, до кучи обвиняя в

кому-то было лень написать несколько "лишних" строк кода

и

преступной глупости
Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Vladimir Goncharov

Если бы вот это было в статье :

а) о периоде за который мы его "среднее" определяем
б) типе среднего
в) и правилах учета "отсутствующего товара". ведь очевидно , что сейчас в моменте его нет, а через 5 минут есть.

все было бы нормально, даже учитывая пассажи про преступную глупость. Вместо этого - очень так себе пересказ статистических парадоксов.

Если считать "мгновенное" среднее

Так у озона за период же, нет там никакого мгновенного, да и еще и по моему по синонимичным запросам идет.

Ответить
Развернуть ветку
54 комментария
Раскрывать всегда