реклама
разместить

Подборка рабочих примеров обработки данных

По стопам моей первой подборки датасетов для машинного обучения сделаю ещё одну — подборку относительно свежих датасетов с рабочими примерами по обработке данных.

Ведь ни для кого не секрет, что обучение на хороших примерах проходит эффективнее и быстрее. Посмотрим, что интересного нам смогут показать одни из лучших примеров по обработке данных.

Схема работы с этим постом такая же, как с моим предыдущим про лучшие блокноты по ML и DS, а именно: сохранил в закладки → передал коллеге.

Подборка рабочих примеров обработки данных

Также бонусом в конце статьи — крутой курс от ФПМИ МФТИ.

Итак, давайте приступим.

Подборка датасетов с рабочими примерами обработки данных

Сравнение социально-экономической информации с показателями самоубийств по годам и странам.

Примеры обработки:

Ежедневный рейтинг 200 самых прослушиваемых песен пользователями Spotify в 53 странах — с 2017 года по 2018 год.

Пример обработки:

Записи из Бостонской системы отчетов о происшествиях с преступностью, включающая в себя происшествия и информацию о том, когда и где оно произошло.

Пример обработки:

Категории, рейтинги, размер всех приложений Google Play.

Пример обработки:

Статистика и особенности покемонов.

Пример обработки:

Данные заголовков новостей, опубликованных за последние 15 лет.

Пример обработки:

Полная история авиакатастроф по всему миру — с 1908 года по настоящее время.

Пример обработки:

Высококачественный набор данных для задачи обнаружения сарказма.

Пример обработки:

Данные о качестве воздуха, собранные на наружных мониторах по всей территории США.

Пример обработки:

Анализ питания каждого пункта меню в McDonald's США.

Пример обработки:

Детали, комплекты, цвета и запасы каждого официального набора Lego в базе данных Rebrickable.

Пример обработки:

Объёмы импорта и экспорта для 5000 товаров в большинстве стран мира за последние 30 лет.

Пример обработки:

Полная информация о различных аспектах преступлений, совершенных в Индии с 2001 года.

Пример обработки:

Данные по пульсарам, собранные во время обзора Вселенной.

Примеры обработки:

Данные, показывающие равенство и неравенство во Франции.

Пример обработки:

Данные переписи в США.

Пример обработки:

Цены на жилье в Калифорнии.

Пример обработки:

Данные по безработице министерства труда США.

Пример обработки:

Набор записей, которые детализируют информацию о персонажах игрока в игре с течением времени.

Пример обработки:

Данные о событиях гравитационных волн GW150914.

Пример обработки:

Бонус

А бонусом у нас сегодня будет прекрасный курс по Deep Learning, рассчитанный на старшеклассников, интересующихся программированием и математикой, а также студентов, которые хотят начать заниматься глубоким обучением.

Цель курса — познакомить с основными принципами глубокого обучения (нейронных сетей) в интерактивном формате и на примере практических задач.

Программа курса

Также вы можете заглянуть на YouTube-канал Deep Learning School. Там много отличных видео ;)

На этом наша короткая подборка примеров обработки данных подошла к концу. Надеюсь, вы узнали для себя что-нибудь новое. Как принято на vc.ru, понравился пост — поставь плюс и не забудь поделиться с коллегами.

Также, если у вас есть то, чем вы можете поделиться сами, — пишите в комментариях. Больше информации о машинном обучении и Data Science здесь.

Всем знаний!

2222
реклама
разместить
5 комментариев

0 комментов и десятки закладок это видимо "нихрена не понял, но должно пригодиться"

5

(оставил мудрый комментарий с умным видом)

2

Не скрою- глубоко не вдавался в статью, но все же возник вопрос: для чего она вообще? Не то чтобы я критикую автора, но я реально не врубился о чем она, тут же просто сайты со статистикой?

Эту статью нужно скормить AI, чтобы он выявил закономерности в этом датасете датасетов. Вручную такое никто не читает, не парься.

1

Курсы в школе [https://www.dlschool.org/] бесплатные? Всех берете или жесткий отбор?

СК завёл против блогера Александры Митрошиной уголовное дело об отмывании денег

В 2023-м она была фигурантом дела о неуплате 127 млн рублей налогов.

Источник: «<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ft.me%2Fskmoscowgsu%2F4453&postId=1852382" rel="nofollow noreferrer noopener" target="_blank">Столичный СК</a>»
55
33
33
11
реклама
разместить
Приезжайте к нам в Германию, у нас айтишники живут в коммуналках и пляшут с бубном, чтобы выжить

За 6 лет я успела поработать в трех крупных IT-компаниях, несколько раз меняла жилье и переехала из Мюнхена в Берлин. В статье я расскажу про немецкую бюрократию, налоги и почему даже айтишники с высокими зарплатами живут в коммуналках. А еще, как в Германии искать работу и жилье, сколько стоит здесь лечиться и жить, и как вы можете остаться без ви…

У меня дом 2016 года постройки. Это не лучшее фото фасада — я сделала снимок, чтобы показать последствия новогодних празднований в Берлине. Кто-то запустил фейерверк — квартира сгорела, фасад на несколько этажей закоптился. Но в целом дом чистый и уютный.
5757
66
44
22
11
Знакомый вернулся из Германии после трех лет работы там. Говорит, что не выдержал именно бюрократии и того, что к русским относятся как к людям второго сорта. В статье автор это деликатно обходит, но это реальность.
Инфляция в феврале — по году остаётся двузначная. Темпы марта всё равно выше прошлого года, не помогает даже укрепление рубля
Инфляция в феврале — по году остаётся двузначная. Темпы марта всё равно выше прошлого года, не помогает даже укрепление рубля
44
11
Telegram выпустил обновление с платными сообщениями и комментариями

Это поможет фильтровать входящие сообщения и избавиться от спама, считают в компании.

1010
55
44
33
33
11
Я вообще за то, чтобы только премиум пользователи сидели в нем, а то если денег нет - то пусть не сидят в тг
«Русского Boeing пока не появилось»: главное из интервью главы торговой палаты США в России

Исполнительный директор AmCham Russia Роберт Эйджи в разговоре с РБК порассуждал о возвращении американского бизнеса и о его конкуренции с Китаем на российском рынке.

Роберт Эйджи. Источник фото: Михаил Гребенщиков / РБК
99
33
22
22
11
Для Cisco дорога закрыта навсегда. Они никогда не пройдут сертификацию на соответствие требованиям ИБ. Боинг я бы тоже пускал только с требованием частичной локализации
Управляющий партнёр Y Combinator Джаред Фридман рассказал, что у четверти стартапов акселератора 95% кодовой базы сгенерировано ИИ

Глава YC предупредил, что разработчикам всё равно необходимы знания в программировании.

Кадр из беседы главы YC Гарри Тана с партнёрами. Источник: Y Combinator
55
Налоговая начала массово проверять селлеров на предмет фиктивного переезда в льготные УСН 1% регионы. На что обратить внимание?
Налоговая начала массово проверять селлеров на предмет фиктивного переезда в льготные УСН 1% регионы. На что обратить внимание?
Президент США Дональд Трамп подписал указ о крипторезерве

Он может состоять примерно из 200 тысяч биткоинов, заявил спецпредставитель по ИИ и криптовалютам Дэвид Сакс.

Источник фото: David Sacks / X
2929
44
33
22
11
Потому шо баксу уже никто не верит. Сейчас на пробу аккумулируют биткоинов а потом на всю котлету вложатся в крипто-рубль.
[]