Прорабатываем навык использования группировки и визуализации данных в Python
В датасете на GitHub проанализируем несколько характеристик и построим набор визуализаций.
По традиции вначале определим цели:
Сгруппировать данные по полу и году и визуализировать общую динамику рождаемости обоих полов.
Найти самые популярные имена за всю историю.
Разбить весь временной промежуток в данных на десять частей и для каждой найти самое популярное имя каждого пола. Для каждого найденного имени визуализировать его динамику за всё время.
Для каждого года рассчитать, сколько имён покрывает 50% людей, и визуализировать (мы увидим разнообразие имён за каждый год).
Выбрать четыре года из всего промежутка и отобразить для каждого года распределение по первой и последней буквам в имени.
Составить список из нескольких известных людей (президенты, певцы, актёры, киногерои) и оценить их влияние на динамику имён. Построить наглядную визуализацию.
Меньше слов, больше кода! И поехали.
1. Сгруппируем данные по полу и году и визуализируем общую динамику рождаемости обоих полов.
2. Найдём самые популярные имена за всю историю.
3. Разобьём весь временной промежуток в данных на десять частей и для каждой найдём самое популярное имя каждого пола. Для каждого найденного имени визуализируем его динамику за всё время.
4. Для каждого года рассчитаем, сколько имён покрывает 50% людей, и визуализируем эти данные.
5. Выберем четыре года из всего промежутка и отобразим для каждого года распределение по первой и последней буквам в имени.
6. Составим список из нескольких известных людей (президенты, певцы, актёры, киногерои) и оценим их влияние на динамику имён.
Для тренировки можете из последнего примера добавить в визуализацию период жизни знаменитости, чтобы для наглядности оценить их влияние на динамику имён.
На этом все наши цели были достигнуты и выполнены. Мы проработали навык использования средств группирования и визуализации данных в Python и будем работать с данными дальше. Выводы по уже готовым, визуализированным данным каждый сможет сделать сам.
Комментарий недоступен
Комментарий недоступен
Комментарий недоступен
Как по мне , так статья полезная!
Комментарий недоступен
Комментарий удален модератором
Комментарий удален модератором