Кто кого: Pandas VS SQL

Еще порядка 10 лет назад для работы по исследованию данных было достаточно SQL, как инструмента для выборки данных и формирования отчетов по ним. Но время не стоит на месте, и примерно в 2012 году стала стремительно набирать популярность Python-библиотека Pandas. И вот сегодня уже сложно представить работу Data Scientist’а без данного модуля.

99

1) Срез по столбцам делается проще: df[['col_name_1', 'col_name_1']]
2) Почему-то забывают про сводные таблицы в панде https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.pivot_table.html
3) А с помощью библиотеки matplotlib, данные сразу можно визуализировать в виде графиков.

1
Ответить
Автор

1) Вы правы, вызывать несколько колонок таким образом и правда проще. Стоило более подробно остановиться на всех возможностях обращения к элементам Dataframe через loc
2) Тоже хороший комментарий, можно описать возможность реализации агрегированных функций из SQL пандасской pivot_table.
3) В посте не стояло цели описать все способы работы с датафреймами, я скорее пытался показать аналогичные sql-запросам методы pandas. Pandas.DataFrame - очень удобный инструмент для работы с табличными данными, а что делать с ними дальше уже зависит от задачи.
Благодарю вас за комментарий )

Ответить