NTA

Визуализация в Python. Seaborn

Для демонстрации визуализации данных при помощи библиотеки Seaborn будем использовать таблицу bank.csv, взятую из открытых источников, и доработанную мной для демонстрации возможностей нашей библиотеки.

Рассмотрим решение некоторых задач при помощи Seaborn:

1. Импортируем нужные библиотеки:

import pandas as pd from matplotlib import pyplot as plt import seaborn as sns

2. При помощи библиотеки Pandas открываем нужную таблицу

bank_data = pd.read_csv('C:/bank.csv',delimiter=',') bank_data.head(S)

3. Количество записей и столбцов можно узнать при помощи функции »shape» из Pandas. В представленных банковских данных 4521 строка и 17 столбцов

bank_data.shape

4. При помощи функции »describe», все из той же Pandas, можно получить подробную информацию о столбцах, таких как: количество, среднее, минимальное и максимальное значения

bank_data.describe()

Из результатов, полученных при помощи оговоренной ранее функции, можно сделать ряд выводов:

  1. Минимальный возраст равен 19 лет, максимальный 87 лет, а средний возраст клиентов составляет 41 год;
  2. Минимальный баланс составляет -3313, максимальный 71188, а средний 1422,66;
  3. Максимальная продолжительность взаимодействия с клиентом длилась 3025 секунд, а минимальное время равняется 4 секундам;
  4. В рамках одного договора максимальное взаимодействие с клиентом равно 50, минимальное 1.

Далее будем визуализировать имеющиеся данные, а также рассмотрим, как некоторые столбцы соотносятся с целевым столбцом.

1. Соотношение баланса и взятых кредитов, среди клиентов с балансом от 0 до 1400, больше тех, кто не подали заявку на кредит, чем тех, кто это сделал

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.barplot(bank_data['loan'], y = bank_data['balance'])

2. Из следующей диаграммы можно понять, что больше клиентов заключили договор на кредит, при этом с ними связывались 3 раза.

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.barplot(x = bank_data['loan'], y = bank_data['campaign'])

Теперь рассмотрим работу с данными, которые представляют из себя категории. Для большего понимания они приведены ниже.

1. Из диаграмм, приведенных ниже, можно сделать вывод, что люди, занимающие руководящие должности, заключили договор на кредит в большем количестве относительно остальных.

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.countplot(bank_data['job'])

2. Из диаграммы, приведенной далее, можно сделать вывод, что среди заключивших договор на кредит больше людей состоящих в браке, чем одиноких или с неизвестным семейным положением.

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.countplot(bank_data['marital'])

3. В кредитовании в большей степени участвовали люди со средним образованием.

sns.set_style('whitegrid') plt.figure(figsize = (14, 7)) sns.countplot(bank_data['educationl'])

4. Большинство клиентов уже брали ипотечный кредит.

sns.set_style('whitegrid') plt.figure(figsize = (14, 7)) sns.countplot(bank_data['housing'])

5. Большая часть клиентов не брали потребительский кредит.

sns.set_style('whitegrid') plt.figure(figsize = (14, 7)) sns.countplot(bank_data['loan'])

6. Так же для визуализации числовых данных можно использовать тепловую карту для того чтобы продемонстрировать корреляцию.

plt.figure(figsize = (14,7)) cor = bank_data.corr() sns.heatmap(cor, annot=True) plt.show

Подводя итог по кредитным договорам, также можно сделать вывод, что банк потерял прибыль, потому что из 4521 записи на кредит согласились только 691 человек. Этот вывод можно сделать, используя функцию ниже.

(bank_data['loan'] == "yes").sum()

При помощи использования Seaborn, а также вспомогательных функций из других библиотек, вы можете визуализировать данные как вам угодно, я лишь показал самые простые варианты. С более интересными и сложными диаграммами вы можете ознакомиться в официальной документации.

0
2 комментария
Популярные
По порядку

Библиотека отличная, презентация так себе.

0

Спасибо за обратную связь!

0
Читать все 2 комментария
«Вещи должны быть не только функциональными, но и красивыми»: как устроена ландшафтная архитектура Карла Сёренсена

Он дал детям площадку, которую они могли оборудовать так, как хотели, и создал овальные и геометрические сады.

Овальные садовые участки в Неруме Metropolis
Продавец eBay из Кургана стала победителем в финале Всероссийского конкурса «Молодой предприниматель России 2021»

27 ноября в Москве состоялся финал ежегодного конкурса «Молодой предприниматель России 2021». В нём приняли участие предприниматели и самозанятые в возрасте до 35 лет. Всего было подано более 300 заявок из 43 регионов страны.

IPO HashiCorp и Nu Holdings

На бирже пролив уже вторую неделю подряд. Обычно компании переносят IPO в такие моменты до начала роста. Но две компании не побоялись выйти на биржу в нисходящем тренде, давайте их разберём.

Откуда берут взрослые деревья для парков и улиц

А также сколько они стоят и почему выращивать их — неплохой бизнес.

Лучшие стартапы «Трибуны» – Ноябрь 2021 года

Подборка пяти лучших проектов от канала @vchunt.

Маленький стартап против гигантов: Kytch может починить ломающиеся машины для мороженого McDonald's — сети это не нужно Статьи редакции

Джереми О’Салливан и Мелисса Нельсон придумали устройство, которое предотвращает поломку автоматов для мороженого — проблемы с ними есть в 10% ресторанов McDonald’s. Несмотря на убытки франчайзи, сеть его запретила и почти уничтожила Kytch.

Wired
И сотрудников тоже касается: кибербуллинг на рабочем месте
Design vector created by pikisuperstar - www.freepik.com
Мне стало стыдно не знать столицу Сенегала и я создал бота, который помог мне выучить все столицы мира

Теперь я знаю и флаги стран, и их столицы. Хотя с географией всегда было не очень.

Как мы отправили 2000 распечатанных фото вашим мамам за 1 неделю после запуска

Как это получилось и сколько заработали. Без фейлов не обошлось.

Это моя сестра - Таня. Пришла на помощь, пока срочно искали еще одного менеджера
SkillFactory раздает подарки: повышенная ставка и новогодний марафон для вебмастеров

В преддверии Нового года мы решили порадовать своих настоящих и будущих партнеров — участников партнерской программы школ Skillfactory, Contented и Product LIVE. Это возможность получить денежный бонус и заодно увеличить прибыль от продажи наших курсов.

Яндекс.Маркет не выплачивает деньги за заказы

В нашем случае история началась 16 ноября, когда нам по магазинам ID 1112344, 1366786, 1246337, 1366785 (договора №1947529/21 от 20 мая 2021 и №2282294/21 от 18 авг. 2021) когда не пришли по плану средства за заказы по всем указанным магазинам (примерная сумма выплаты 4,5 миллиона рублей)

null