Подборка рабочих примеров обработки данных

По стопам моей первой подборки датасетов для машинного обучения сделаю ещё одну — подборку относительно свежих датасетов с рабочими примерами по обработке данных.

В закладки

Ведь ни для кого не секрет, что обучение на хороших примерах проходит эффективнее и быстрее. Посмотрим, что интересного нам смогут показать одни из лучших примеров по обработке данных.

Схема работы с этим постом такая же, как с моим предыдущим про лучшие блокноты по ML и DS, а именно: сохранил в закладки → передал коллеге.

Также бонусом в конце статьи — крутой курс от ФПМИ МФТИ.

Итак, давайте приступим.

Подборка датасетов с рабочими примерами обработки данных

Suicide Rates Overview 1985 to 2016

Сравнение социально-экономической информации с показателями самоубийств по годам и странам.

Примеры обработки:

Spotify's Worldwide Daily Song Ranking

Ежедневный рейтинг 200 самых прослушиваемых песен пользователями Spotify в 53 странах — с 2017 года по 2018 год.

Пример обработки:

Crimes in Boston

Записи из Бостонской системы отчетов о происшествиях с преступностью, включающая в себя происшествия и информацию о том, когда и где оно произошло.

Пример обработки:

Google Play Store Apps

Категории, рейтинги, размер всех приложений Google Play.

Пример обработки:

Pokémon for Data Mining and Machine Learning

Статистика и особенности покемонов.

Пример обработки:

A Million News Headlines

Данные заголовков новостей, опубликованных за последние 15 лет.

Пример обработки:

Airplane Crashes Since 1908

Полная история авиакатастроф по всему миру — с 1908 года по настоящее время.

Пример обработки:

News Headlines Dataset For Sarcasm Detection

Высококачественный набор данных для задачи обнаружения сарказма.

Пример обработки:

Historical Air Quality

Данные о качестве воздуха, собранные на наружных мониторах по всей территории США.

Пример обработки:

Nutrition Facts for McDonald's Menu

Анализ питания каждого пункта меню в McDonald's США.

Пример обработки:

Lego Database

Детали, комплекты, цвета и запасы каждого официального набора Lego в базе данных Rebrickable.

Пример обработки:

Global Commodity Trade Statistics

Объёмы импорта и экспорта для 5000 товаров в большинстве стран мира за последние 30 лет.

Пример обработки:

Crime in India

Полная информация о различных аспектах преступлений, совершенных в Индии с 2001 года.

Пример обработки:

Predicting a Pulsar Star

Данные по пульсарам, собранные во время обзора Вселенной.

Примеры обработки:

French employment, salaries, population per town

Данные, показывающие равенство и неравенство во Франции.

Пример обработки:

United States Census

Данные переписи в США.

Пример обработки:

California Housing Prices

Цены на жилье в Калифорнии.

Пример обработки:

US Unemployment Rate by County, 1990–2016

Данные по безработице министерства труда США.

Пример обработки:

World of Warcraft Avatar History

Набор записей, которые детализируют информацию о персонажах игрока в игре с течением времени.

Пример обработки:

The Gravitational Waves Discovery Data

Данные о событиях гравитационных волн GW150914.

Пример обработки:

Бонус

А бонусом у нас сегодня будет прекрасный курс по Deep Learning, рассчитанный на старшеклассников, интересующихся программированием и математикой, а также студентов, которые хотят начать заниматься глубоким обучением.

Цель курса — познакомить с основными принципами глубокого обучения (нейронных сетей) в интерактивном формате и на примере практических задач.

Программа курса

Также вы можете заглянуть на YouTube-канал Deep Learning School. Там много отличных видео ;)

На этом наша короткая подборка примеров обработки данных подошла к концу. Надеюсь, вы узнали для себя что-нибудь новое. Как принято на vc.ru, понравился пост — поставь плюс и не забудь поделиться с коллегами.

Также, если у вас есть то, чем вы можете поделиться сами, — пишите в комментариях. Больше информации о машинном обучении и Data Science здесь.

Всем знаний!

Материал опубликован пользователем. Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Рушан Сюрмаков", "author_type": "self", "tags": [], "comments": 5, "likes": 26, "favorites": 101, "is_advertisement": false, "subsite_label": "dev", "id": 76126, "is_wide": false, "is_ugc": true, "date": "Sat, 20 Jul 2019 19:23:36 +0300" }
{"average":26348,"one":95,"ten":75}
Сколько денег вы откладываете в месяц?
Ответьте и узнаете, сколько копят другие.
0 ₽
70 000+ ₽
0 ₽
{ "id": 76126, "author_id": 217512, "diff_limit": 1000, "urls": {"diff":"\/comments\/76126\/get","add":"\/comments\/76126\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/76126"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 235819, "last_count_and_date": null }
5 комментариев

Популярные

По порядку

5

0 комментов и десятки закладок это видимо "нихрена не понял, но должно пригодиться"

Ответить
2

(оставил мудрый комментарий с умным видом)

Ответить
0

Не скрою- глубоко не вдавался в статью, но все же возник вопрос: для чего она вообще? Не то чтобы я критикую автора, но я реально не врубился о чем она, тут же просто сайты со статистикой?

Ответить
1

Эту статью нужно скормить AI, чтобы он выявил закономерности в этом датасете датасетов. Вручную такое никто не читает, не парься.

Ответить
0

Курсы в школе [https://www.dlschool.org/] бесплатные? Всех берете или жесткий отбор?

Ответить
0
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } } ]
Компания отказалась от email
в пользу общения при помощи мемов
Подписаться на push-уведомления
{ "page_type": "default" }