Подборка рабочих примеров обработки данных

По стопам моей первой подборки датасетов для машинного обучения сделаю ещё одну — подборку относительно свежих датасетов с рабочими примерами по обработке данных.

Ведь ни для кого не секрет, что обучение на хороших примерах проходит эффективнее и быстрее. Посмотрим, что интересного нам смогут показать одни из лучших примеров по обработке данных.

Схема работы с этим постом такая же, как с моим предыдущим про лучшие блокноты по ML и DS, а именно: сохранил в закладки → передал коллеге.

Подборка рабочих примеров обработки данных

Также бонусом в конце статьи — крутой курс от ФПМИ МФТИ.

Итак, давайте приступим.

Подборка датасетов с рабочими примерами обработки данных

Сравнение социально-экономической информации с показателями самоубийств по годам и странам.

Примеры обработки:

Ежедневный рейтинг 200 самых прослушиваемых песен пользователями Spotify в 53 странах — с 2017 года по 2018 год.

Пример обработки:

Записи из Бостонской системы отчетов о происшествиях с преступностью, включающая в себя происшествия и информацию о том, когда и где оно произошло.

Пример обработки:

Категории, рейтинги, размер всех приложений Google Play.

Пример обработки:

Статистика и особенности покемонов.

Пример обработки:

Данные заголовков новостей, опубликованных за последние 15 лет.

Пример обработки:

Полная история авиакатастроф по всему миру — с 1908 года по настоящее время.

Пример обработки:

Высококачественный набор данных для задачи обнаружения сарказма.

Пример обработки:

Данные о качестве воздуха, собранные на наружных мониторах по всей территории США.

Пример обработки:

Анализ питания каждого пункта меню в McDonald's США.

Пример обработки:

Детали, комплекты, цвета и запасы каждого официального набора Lego в базе данных Rebrickable.

Пример обработки:

Объёмы импорта и экспорта для 5000 товаров в большинстве стран мира за последние 30 лет.

Пример обработки:

Полная информация о различных аспектах преступлений, совершенных в Индии с 2001 года.

Пример обработки:

Данные по пульсарам, собранные во время обзора Вселенной.

Примеры обработки:

Данные, показывающие равенство и неравенство во Франции.

Пример обработки:

Данные переписи в США.

Пример обработки:

Цены на жилье в Калифорнии.

Пример обработки:

Данные по безработице министерства труда США.

Пример обработки:

Набор записей, которые детализируют информацию о персонажах игрока в игре с течением времени.

Пример обработки:

Данные о событиях гравитационных волн GW150914.

Пример обработки:

Бонус

А бонусом у нас сегодня будет прекрасный курс по Deep Learning, рассчитанный на старшеклассников, интересующихся программированием и математикой, а также студентов, которые хотят начать заниматься глубоким обучением.

Цель курса — познакомить с основными принципами глубокого обучения (нейронных сетей) в интерактивном формате и на примере практических задач.

Программа курса

Также вы можете заглянуть на YouTube-канал Deep Learning School. Там много отличных видео ;)

На этом наша короткая подборка примеров обработки данных подошла к концу. Надеюсь, вы узнали для себя что-нибудь новое. Как принято на vc.ru, понравился пост — поставь плюс и не забудь поделиться с коллегами.

Также, если у вас есть то, чем вы можете поделиться сами, — пишите в комментариях. Больше информации о машинном обучении и Data Science здесь.

Всем знаний!

2222
5 комментариев

0 комментов и десятки закладок это видимо "нихрена не понял, но должно пригодиться"

5
Ответить

(оставил мудрый комментарий с умным видом)

2
Ответить

Не скрою- глубоко не вдавался в статью, но все же возник вопрос: для чего она вообще? Не то чтобы я критикую автора, но я реально не врубился о чем она, тут же просто сайты со статистикой?

Ответить

Эту статью нужно скормить AI, чтобы он выявил закономерности в этом датасете датасетов. Вручную такое никто не читает, не парься.

1
Ответить

Курсы в школе [https://www.dlschool.org/] бесплатные? Всех берете или жесткий отбор?

Ответить