NTA

Визуализация в Python. Seaborn

Для демонстрации визуализации данных при помощи библиотеки Seaborn будем использовать таблицу bank.csv, взятую из открытых источников, и доработанную мной для демонстрации возможностей нашей библиотеки.

Рассмотрим решение некоторых задач при помощи Seaborn:

1. Импортируем нужные библиотеки:

import pandas as pd from matplotlib import pyplot as plt import seaborn as sns

2. При помощи библиотеки Pandas открываем нужную таблицу

bank_data = pd.read_csv('C:/bank.csv',delimiter=',') bank_data.head(S)

3. Количество записей и столбцов можно узнать при помощи функции »shape» из Pandas. В представленных банковских данных 4521 строка и 17 столбцов

bank_data.shape

4. При помощи функции »describe», все из той же Pandas, можно получить подробную информацию о столбцах, таких как: количество, среднее, минимальное и максимальное значения

bank_data.describe()

Из результатов, полученных при помощи оговоренной ранее функции, можно сделать ряд выводов:

  1. Минимальный возраст равен 19 лет, максимальный 87 лет, а средний возраст клиентов составляет 41 год;
  2. Минимальный баланс составляет -3313, максимальный 71188, а средний 1422,66;
  3. Максимальная продолжительность взаимодействия с клиентом длилась 3025 секунд, а минимальное время равняется 4 секундам;
  4. В рамках одного договора максимальное взаимодействие с клиентом равно 50, минимальное 1.

Далее будем визуализировать имеющиеся данные, а также рассмотрим, как некоторые столбцы соотносятся с целевым столбцом.

1. Соотношение баланса и взятых кредитов, среди клиентов с балансом от 0 до 1400, больше тех, кто не подали заявку на кредит, чем тех, кто это сделал

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.barplot(bank_data['loan'], y = bank_data['balance'])

2. Из следующей диаграммы можно понять, что больше клиентов заключили договор на кредит, при этом с ними связывались 3 раза.

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.barplot(x = bank_data['loan'], y = bank_data['campaign'])

Теперь рассмотрим работу с данными, которые представляют из себя категории. Для большего понимания они приведены ниже.

1. Из диаграмм, приведенных ниже, можно сделать вывод, что люди, занимающие руководящие должности, заключили договор на кредит в большем количестве относительно остальных.

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.countplot(bank_data['job'])

2. Из диаграммы, приведенной далее, можно сделать вывод, что среди заключивших договор на кредит больше людей состоящих в браке, чем одиноких или с неизвестным семейным положением.

sns.set_style('whitegrid') plt.figure(figsize = (14,7)) sns.countplot(bank_data['marital'])

3. В кредитовании в большей степени участвовали люди со средним образованием.

sns.set_style('whitegrid') plt.figure(figsize = (14, 7)) sns.countplot(bank_data['educationl'])

4. Большинство клиентов уже брали ипотечный кредит.

sns.set_style('whitegrid') plt.figure(figsize = (14, 7)) sns.countplot(bank_data['housing'])

5. Большая часть клиентов не брали потребительский кредит.

sns.set_style('whitegrid') plt.figure(figsize = (14, 7)) sns.countplot(bank_data['loan'])

6. Так же для визуализации числовых данных можно использовать тепловую карту для того чтобы продемонстрировать корреляцию.

plt.figure(figsize = (14,7)) cor = bank_data.corr() sns.heatmap(cor, annot=True) plt.show

Подводя итог по кредитным договорам, также можно сделать вывод, что банк потерял прибыль, потому что из 4521 записи на кредит согласились только 691 человек. Этот вывод можно сделать, используя функцию ниже.

(bank_data['loan'] == "yes").sum()

При помощи использования Seaborn, а также вспомогательных функций из других библиотек, вы можете визуализировать данные как вам угодно, я лишь показал самые простые варианты. С более интересными и сложными диаграммами вы можете ознакомиться в официальной документации.

0
2 комментария
Популярные
По порядку

Библиотека отличная, презентация так себе.

0

Спасибо за обратную связь!

0
Читать все 2 комментария
Мне стало стыдно не знать столицу Сенегала и я создал бота, который помог мне выучить все столицы мира

Теперь я знаю и флаги стран, и их столицы. Хотя с географией всегда было не очень.

Яндекс.Маркет не выплачивает деньги за заказы

В нашем случае история началась 16 ноября, когда нам по магазинам ID 1112344, 1366786, 1246337, 1366785 (договора №1947529/21 от 20 мая 2021 и №2282294/21 от 18 авг. 2021) когда не пришли по плану средства за заказы по всем указанным магазинам (примерная сумма выплаты 4,5 миллиона рублей)

И сотрудников тоже касается: кибербуллинг на рабочем месте
Design vector created by pikisuperstar - www.freepik.com
Маленький стартап против гигантов: Kytch может починить ломающиеся машины для мороженого McDonald's — сети это не нужно Статьи редакции

Джереми О’Салливан и Мелисса Нельсон придумали устройство, которое предотвращает поломку автоматов для мороженого — проблемы с ними есть в 10% ресторанов McDonald’s. Несмотря на убытки франчайзи, сеть его запретила и почти уничтожила Kytch.

Wired
Дайджест новостей Сбера: сайт Digital Пётр, сценарии для умного дома и платина от Forbes

Прошлый дайджест мы целиком посвятили 180-летию Сбера, поэтому новостей накопилось много. Среди них — запуск сайта по распознаванию рукописей Петра I, большое обновление на платформе умного дома Sber и другие. Рассказываем всё самое интересное.

Картинка, сгенерированная ruDALL-E по запросу «рыжий котик»
Продавец eBay из Кургана стала победителем в финале Всероссийского конкурса «Молодой предприниматель России 2021»

27 ноября в Москве состоялся финал ежегодного конкурса «Молодой предприниматель России 2021». В нём приняли участие предприниматели и самозанятые в возрасте до 35 лет. Всего было подано более 300 заявок из 43 регионов страны.

Лучшие стартапы «Трибуны» – Ноябрь 2021 года

Подборка пяти лучших проектов от канала @vchunt.

Как мы отправили 2000 распечатанных фото вашим мамам за 1 неделю после запуска

Как это получилось и сколько заработали. Без фейлов не обошлось.

Это моя сестра - Таня. Пришла на помощь, пока срочно искали еще одного менеджера
«Вещи должны быть не только функциональными, но и красивыми»: как устроена ландшафтная архитектура Карла Сёренсена

Он дал детям площадку, которую они могли оборудовать так, как хотели, и создал овальные и геометрические сады.

Овальные садовые участки в Неруме Metropolis
SkillFactory раздает подарки: повышенная ставка и новогодний марафон для вебмастеров

В преддверии Нового года мы решили порадовать своих настоящих и будущих партнеров — участников партнерской программы школ Skillfactory, Contented и Product LIVE. Это возможность получить денежный бонус и заодно увеличить прибыль от продажи наших курсов.

IPO HashiCorp и Nu Holdings

На бирже пролив уже вторую неделю подряд. Обычно компании переносят IPO в такие моменты до начала роста. Но две компании не побоялись выйти на биржу в нисходящем тренде, давайте их разберём.

null