Почему ваш pandas работает в 3000 раз медленнее?

Наверное, все пользователи pandas знают, что многие действия можно сделать разными способами. Но далеко не каждый понимает, в чем разница, и почему их код может работать более чем в 3000 раз медленнее, чем у соседа. Давайте разберемся, в чём проблема.

1717

Спасибо за материал!
Для себя сделал вывод, что Pandas больше про понятное представление данных в табличной виде, что актуально для всяких ЮпитерНоутбуков и аналогов. "Под капотом" проекта от него толку нет. Являясь самоучкой, изначально использовал Панду в одном из своих проектов. Код писать не буду, но результаты были примерно следующие: 1:30 при использовании Pandas, 7 секунд на чистых списках, и 5 секунд на массиве Numpy. Алгоритмы везде были идентичные, с поправкой на тип данных. Теперь весь проект переписываю в Numpy. Да, не так удобно (приходится по индексам ориентироваться, а не по именам), но гораздо быстрее работает. А с Пандой пусть играются любители Юпитера и Матплотлиба

Комментарий недоступен

3