{"id":14272,"url":"\/distributions\/14272\/click?bit=1&hash=9c431bca9c7cafdd4ed114bc7fb4d407f06f28aa165d6f80b9637d3a8581e5c2","title":"\u0421\u0431\u0435\u0440\u041a\u043e\u0442 \u2014 \u043f\u0435\u0440\u0432\u044b\u0439 \u0446\u0438\u0444\u0440\u043e\u0432\u043e\u0439 \u0438\u043d\u0444\u043b\u044e\u0435\u043d\u0441\u0435\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u043e\u043b\u0435\u0442\u0435\u043b \u0432 \u043a\u043e\u0441\u043c\u043e\u0441","buttonText":"","imageUuid":""}

Ozon: в расчет средней позиции аналитики заложен неверный алгоритм, поддержка проблему игнорирует

Пишу сюда, потому что мое обращение #14235191 было просто закрыто сотрудником Ozon в одностороннем порядке даже без возможности переоткрыть его и даже без возможности поставить оценку (вообще впервые такое вижу), что продемонстрировав отсутствие интереса решать проблему, которая не столько мешает лично мне, сколько позорит вашу организацию и, возможно, доставляет неудобство другим селлерам.

А теперь к сути:

У Ozon, как известно, есть чудесный инструмент - Аналитика, в котором как-то появилась далеко не самая бесполезная по своей идее метрика - средние позиции товара по запросу.

И все бы в этой фиче было бы хорошо, если не одно "но": реализацией таковой занимался программист, который, по всей видимости, в гробу видал свою работу и от вашего лица плевал на всех партнеров, которые будут данную метрику использовать.

Так что же с этой частью аналитики не так?

Когда только Ozon добавил информацию о средних позициях товара, я начал ее изучать и думать: как это можно применить на практике. И мне хватило буквально несколько минут, чтобы не просто найти противоречия в этих данных, но и понять: от-куда они взялись.

А взялись они из того, что кому-то было лень написать несколько "лишних" строк кода, дабы учесть в аналитике ситуацию, когда товар по тем или иным причинам просто не показывается, а значит и не может иметь данных о своих позициях.

Да, в этом плане данная метрика уникальная: ведь по всем остальным нужно уметь только складывать, а вот в учете позиций попахивает более сложными вычислениями, за которые сотрудникам Ozon, возможно, просто не доплачивают.

Абстрагируемся для того, чтобы ситуация была понятна всем:

Допустим, в школьных соревнованиях должно было участвовать 10 учеников. Из них семеро заболело, а оставшиеся трое заняли 1, 2, 3 места соответственно.

Но какое место заняли ученики в среднем? Математика проста: складываем места, которые заняли ученики (1+2+3) и делим на общее количество участников, участвовавших в соревнованиях: на 3, получая 2, как среднее место.

А что с учениками, которые в соревнованиях не участвовали?

Очевидно, что их никак не "пришить" к расчету среднего места. От слова "совсем". Их просто нужно исключить из расчета. Это очевидно: НЕ участвовавшие в соревнованиях ученики не занимают никаких мест: ни первых, ни последних и нельзя их каким-то образом учитывать в итоговом отчете.

Конечно, если очень хочется все-таки учесть, то можно, например, поставив отсутствующих учеников на последние места - наверняка в каких-то соревнованиях так и поступают.

Но уж точно чего делать не стоит, так это ставить отсутствующих учеников на нулевые места, после чего без каких-либо угрызений совести пихать эти нули в итоговые расчеты.

Но сотрудник из Ozon именно так и поступает: присваивает товару место номер ноль, если он отсутствовал в показах, а потом без каких-либо проблем суммирует эти данные с остальными, деля их на общее число измерений.

Т.е. если бы этого сотрудника попросили предоставить отчет о школьных соревнованиях, то он бы посчитал так: (1+2+3+0*7)/10, заявив о том, что ученики заняли в среднем 0,6 место.

Еще бы интереснее был бы расчет среднего места ученика в разных соревнованиях:

В первом соревновании занял 10-е место, во втором не участвовал. Значит в среднем ученик занимает 5-е место. Здорово, правда?

Я уже молчу про то, что если наш условный сотрудник Ozon без всякого зазрения совести будет складывать и делить места для разных дисциплин вместе: например, соревнования по бегу и контрольные по литературе.

Места в категориях - в кучу, в поиске - в кучу. Запросы по рейтингу, популярности, по цене - все-все кидаем в одну кучу. И даже если это сам селлер искал свой товар по SKU - да тоже в кучу все закинем и на все поделим.

Чего заморачиваться, верно? Пусть "уважаемые партнеры" сами разбираются!

Спасибо за внимание!

P.S. Я не просто так столь детально описал данную проблему. Подобных экстравагантных решений у Ozon хватает (я сейчас именно про раздел аналитики). И причина вовсе не в каких-то ошибках или в неопытности сотрудников, а именно в наплевательском отношении к своей работе. Или же в преступной глупости - допускаю и такой вариант.

0
57 комментариев
Написать комментарий...
Vladimir Goncharov
Очевидно, что их никак не "пришить" к расчету среднего места

Это с какого перепуга взято ? Товар показывается с 0 кол-вом показов, портит вашу метрику, все верно.

наплевательском отношении к своей работе

Нет, просто кто-то даже "Статистику на котиках" не прочел, но свое мнение имеет.
Описание статистических парадоксов тоже феерическое, конечно. И разумеется, все это не спроста - ЗАГОВОР!

Ответить
Развернуть ветку
Andrey Shevtsov
Автор
Это с какого перепуга взято ? Товар показывается с 0 кол-вом показов, портит вашу метрику, все верно.

Кто-то, как я понимаю, даже прочел. Но ума ему это не добавило. При чем тут показы вообще, прошу прощения?

Ответить
Развернуть ветку
631 052

ну вот просто человек убежден, что если показов ноль, то и место товара в списке - нулевое (т.е. даже выше, чем чемпионское - первое).

почему он так решил, вопрос другой.
воскресенье, утро, мало ли

Ответить
Развернуть ветку
Vladimir Goncharov

Писатель статьи путает место в выдаче и частоту появления на этом месте. Если товар за период показывался 1 раз из ста на 1 месте, 10 раз из ста на 5 месте и оставшиеся 89 запросов не показывался - очевидно, что место у него будет на дне, а не наверху. Наверху будет как раз, если нули откинуть

Ответить
Развернуть ветку
Александр Богданов

Так автор говорит о том, что этим 89 запросам присваивается значение 0, нет?

Ответить
Развернуть ветку
631 052

именно. и среднее взлетает вверх.

Ответить
Развернуть ветку
Andrey Shevtsov
Автор

Проблема даже не в этом, ведь подобные данные можно действительно отсечь. Правда, не таким примитивным методом, как предлагает комментатор выше со своей мурзилкой, а разложив значения на линии, где для позиций в рамках одной категории и в один день будет соответствовать статистическому правилу: чем выше место - тем больше должно быть показов. Таким образом можно отсечь не валидные данные. Реальная проблема возникает в ситуациях, когда товар был продан и новые из измерения за этот же день дают нули, усредняя значение. Например, одно измерение - 100, второе - 0, в среднем - 50. Но мы не знаешь цифры из которых складывалось число и сколько было измерений, а значит не можем без дополнительной валидация доверять этим данным вообще. Но наш мурзилкин дальше своих картинок с котиками не ушёл. Советую быть осторожнее с ним - вдруг это заразно.

Ответить
Развернуть ветку
Vladimir Goncharov

Кек, после "мурзилки" афтор видно осознал, что все не настолько банально как он предлагал и начал изобретать гистограммы с нормализациями. Подсказка - что бы снова не сесть в лужу нужно прочесть эту "мурзилку" до конца - там 211 страниц, а ты осилил только 2.

Проблема то ясна - пайтон и нумпай скачал, а базовую подготовки по статистике и терверу нет, зато наглости впереди своего визга вещать о

преступной гупости
несколько сточек кода

хоть отбавляй.И так как их нет - пытается что-то угадать по среднему значению величины с большой дисперсией, отчего стул прожигается и начинаются обвинения в тупизне всех вокруг.

Ответить
Развернуть ветку
Andrey Shevtsov
Автор

Ага, давайте, переходите на личности, выискивайте опечатки, "ты-кайте" мне, хотя я Вас, по всей видимости, раза в два старше. Раз аргументов нет, а лишь желание уязвить. Я же сказал: с Вами дискутировать я не намерен. Смиритесь с этим и ведите себя по-мужски. Провокации Вас не красят.

Ответить
Развернуть ветку
Vladimir Goncharov

Ммм, стрелочку начал поворачивать к ad hominem ?
Напомню-ка твои пописульки, вдруг уже НЕПРИЯТНО И НЕБЫЛО

кому-то было лень написать несколько "лишних" строк кода
реализацией таковой занимался программист, который, по всей видимости, в гробу видал свою работу и от вашего лица плевал на всех партнеров
причина вовсе не в каких-то ошибках или в неопытности сотрудников, а именно в наплевательском отношении к своей работе. Или же в преступной глупости

Совсем это не переходы на личности, да. Вообще.

Далее, я не опечатки нашел, а корявое и неполное описание выборок. Которые ты же и побежал править в камментах закрыв глазки на свои же советы про ПРОСТА НОЛЬ УБРЯТИЯ ХАХАТУПЫЕ.
Не забывая быстренько "перейти на личности"

мурзилкин

При том, что "мурзилка" была в лог-листе премии Просвещение 2017 года. Но конечно -. т.к. НЕПРИЯТНО, то жа, обьявим быстренько "мурзилкой".

аргументов нет
способ выбрасывания нулей полностью кроется 2 страницами комикса
Ну короч другой придумал, хаха, не такой простой, ХАХАХА
НЕТ АРГУМЕНТОВ

Ясно.

раза в два старше

Опять ошибка, я старше на 5 лет

с Вами дискутировать я не намерен

А я не вам пишу, я для норот.
Что бы самоучку-питониста не принимали за пророка.

Ответить
Развернуть ветку
Andrey Shevtsov
Автор

Ну я так и понял: очередной завистник. Давно вынашивали план блеснуть умом на моем фоне? ))) Забыл что таких чудиков в игнор отправлять можно, дабы не беспокоили, успехов!

Ответить
Развернуть ветку
Владислав Мальцев

Очередные завистники нашего легендарного инфогуру, скрывающего от приставов с миллионными долгами.

От которого отказался даже родной отец, принудительно через суд выписавший его из своего дома))) ибо всех задолбали приходящих туда люди у которых Андрюша занял денег и исчез

Ответить
Развернуть ветку
Andrey Shevtsov
Автор

Мальцев, смотрю жив-здоров, ну и слава Богу!

Ответить
Развернуть ветку
54 комментария
Раскрывать всегда