С каждым днем количество данных становится больше и больше. И как говорится, чем больше ты знаешь, тем больше ты задаешь вопросов, и тем больше ты хочешь получить ответов. Получить ответы на основе данных можно с помощью статистики. А именно, если требуется что-то сравнить, поможет проверка статистических гипотез.
меня тут скорее остановило то, что код явно откуда скопирован, но даже не проверен
множества подпихивать в пд.конкат - это конечно сильно
Это типичный код для проверки данного вопроса с использованием scipy.stats. Может быть, что-то и было взято из других статей при изучении материала, но это какая-то незначительная часть. Насчет множества и конкат, можете посоветовать правильный метод?