10 малоизвестных библиотек Python, которые стоит использовать программистам в 2023 году
Python долгое время был одним из самых популярных языков программирования. Он имеет широкий спектр хорошо известных и часто используемых библиотек, таких как NumPy, Pandas и Matplotlib. Однако, существует несколько малоизвестных библиотек Python, которые могут иметь большое значение в карьере программиста. В этой статье я попытался рассказать о 10 таких библиотеках, ведь действительно стоит задуматься о том, чтобы начать использовать их в 2023 году.
t.me/ai_machinelearning_big_data - огромное количество уроков, бесплатных нейросетей , Python гайдов и другого крутого материала в моем телеграм канале.
PyGWalker: PyGWalker упрощает рабочий процесс анализа и визуализации данных в Jupyter Notebook, превращая фрейм данных pandas (или фрейм данных polars) в пользовательский интерфейс в стиле Tableau для визуального исследования.
Приведённый выше график показывает интерфейс, похожий на таблицу, использующий файл excel hour.csv, в котором содержится сумма скорости ветра за каждый месяц. Конечно, всегда можно поэкспериментировать с разными параметрами по осям X и Y.
SciencePlots: Создаёт профессиональные графики matplotlib для презентаций, исследовательских работ и т.д.
Приведённый выше код использует комбинацию стилей ‘fivethirtyeight’ и ’dark_background’. Хотя лучше ознакомиться со списком уже доступных стилей (используя приведённый ниже код), иначе в программе легко могут возникнуть ошибки из-за отсутствия какого-либо стиля.
CleverCSV: Устраняет ошибки синтаксического анализа при чтении CSV-файлов с помощью Pandas.
В этом примере функция clevercsv.reader() используется для чтения CSV-файла с именем 'hour.csv' из предыдущей задачи. Функция принимает несколько параметров, включая объект file, символ-разделитель (в данном случае запятую) и символ кавычки (в данном случае двойную кавычку).
Объект csv_reader, возвращаемый clevercsv.reader(), может быть повторён для извлечения каждой строки CSV-файла в виде списка. В этом примере каждая строка выводится на консоль.
Обратите внимание, что CleverCSV автоматически устраняет распространённые проблемы с CSV-файлами, такие как несоответствующие разделители полей или символы кавычек. Это делает его полезным инструментом для работы с беспорядочными или плохо отформатированными CSV-файлами.
fastparquet: Ускоряет ввод-вывод pandas в 5 раз.
В этом примере библиотека fastparquet используется для записи фрейма данных pandas в файл Parquet, а затем считывания его обратно в новый фрейм данных. fastparquet - это высокопроизводительная реализация формата Parquet на Python, предназначенная для бесперебойной работы с фреймами данных Pandas. Она обеспечивает быструю производительность чтения и записи, эффективное сжатие и поддержку широкого спектра типов данных.
nbcommands: Позволяет легко выполнять поиск кода в Jupyter notebooks, а не выполнять это вручную.
Bottleneck: ускоряет работу методов NumPy в 25 раз. Особенно, если массив имеет значения NaN.
В этом коде библиотека bottleneck импортируется как bn. Затем создаётся 2D массив NumPy с 1000 строками и 10 столбцами со случайными значениями.
Далее функция move_mean используется из Bottleneck для вычисления скользящего среднего для каждой строки в массиве. Параметр window указывает количество значений, которые будут использоваться при вычислении каждого скользящего среднего, а параметр axis указывает ось, вдоль которой будет вычисляться скользящее среднее (в данном случае мы вычисляем его для каждой строки, поэтому устанавливаем axis=1).
Наконец, выводится результирующий массив скользящих средних. Это лишь один пример того, как Bottleneck может быть использовано в коде Python для повышения производительности вычислений.
multipledispatch: включает перегрузку функций в Python.
В этом примере функция add определена и имеет три реализации, каждая из которых принимает разные типы входных данных. Декоратор @dispatch используется для указани�� того, какую реализацию использовать на основе типов ввода. Когда функция add вызывается с аргументами разных типов, multipledispatch автоматически выбирает правильную реализацию на основе сигнатуры типа аргументов. Это позволяет легко писать чистый и читаемый код, который может обрабатывать несколько типов входных данных.
Aquarel: Стили графиков matplotlib.
modelstore: Версия моделей машинного обучения для лучшего отслеживания.
Pigeon: Аннотирование данные щелчками кнопок в Jupyter notebook.
В этом примере функция annotate импортируется из библиотеки Pigeon, параметры определены для меток, а данные загружены из файла .CSV. Функция annotate используется для того, чтобы предложить аннотатору пометить каждую категорию (в данном случае "stroke") набора данных одним из определённых параметров (Positive или Negative). Наконец, аннотации сохраняются в CSV-файл.
В заключение отметим, что Python - это мощный и универсальный язык программирования с огромным набором библиотек на выбор. Хотя существует множество популярных библиотек, важно не упускать из виду менее известные из них, которые могут предложить уникальную и ценную функциональность. 10 библиотек, упомянутых в этой статье, - это лишь небольшая выборка из множества скрытых жемчужин, ожидающих своего открытия в экосистеме Python. Исследуя и экспериментируя с этими библиотеками, разработчики могут расширить свои наборы инструментов и получить новые идеи и возможности, которые могут помочь им решать даже самые сложные проблемы.
На этом заканчивается статья о 10 малоизвестных библиотеках Python, которые программисты должны использовать в 2023 году. Следите за обновлениями и за другими статьями, связанными с python, EDA, машинным обучением, глубоким обучением, вариантами использования ChatGPT и NLP, а также различными проектами.
Github: https://github.com/abhigyan631
Статья была взята из этого источника: