Впервые я узнал о DuckDB в сентябре 2022 года, находясь в PyCon Spain в Гранаде. Теперь, после 6 месяцев его использования, я не могу без него жить. И я хочу внести свой вклад в сообщество, предоставив моим коллегам-программистам и специалистам, связанным с данными, введение в эту фантастическую аналитическую систему баз данных.
Но время выполнения с использованием Pandas почти в 4 раза быстрее, если сравнить его с реализацией DuckDB.
Кажется здесь опечатка, ведь выполнение кода на Pandas заняло 434 миллисекунды, а с DuckDB – 112 миллисекунд.
к тому же для справедливости в вариант с Pandas стоит добавить получение объекта df