реклама
разместить

Неформальная математика в Data Science

Зачем учить науку, за которую всё равно не дадут Нобелевку

Неформальная математика в Data Science

Привет, это karpov.courses!

Математики говорят и пишут на непонятном языке, стильно выглядят и раскрывают тайны Вселенной. Если вас тоже манит математика, но вы не знаете, как к ней подступиться, — читайте дальше.

О чём расскажем:

Почему так сложно

Математика много лет создавала себе имидж неприступной крепости и успешно отпугивала людей от работы мечты. «Нужна ли в Data Science математика» — один из самых популярных поисковых запросов про большие данные.

Для неподготовленного человека всё кажется страшным: формулы с непонятными обозначениями, абстрактные умозаключения, неочевидное применение в реальной жизни. Это выглядит так сложно, что даже Альфред Нобель не увидел ничего полезного и запретил давать свою премию за математические открытия.

Неформальная математика в Data Science

Если бы Нобель увидел сегодняшний мир, то, возможно, раскаялся бы. Шифрование частных данных, маркетинговые исследования, оценки скорости технических производств — всё это решают математики. А положенные на законы физики уравнения вообще описывают всё наше мироздание. Если не верите, почитайте или послушайте про теорию Янга — Миллса.

Практическое применение математике нашлось, но проще от этого она не стала.

Можно ли не отбить желание учить это всё

Если рассказать на человеческом языке какое-то сложное формальное математическое понятие, получится именно та наука, которая отпугивает почти всех заинтересовавшихся людей.

Чтобы упростить общение хотя бы между собой, математики придумали специальный язык — математические нотации. Они тоже выглядят непросто, но с ними все определения выглядят компактнее и позволяют учёным из разных стран понимать друг друга.

Неформальная математика в Data Science

Если разобрать хотя бы несколько математических символов, станет уже не так страшно. Даже в самой трудной формуле можно будет находить знакомые определения и примерно понимать, о чём речь.

И вообще, не понимать нормально. Даже сами математики часто не разбираются в работах своих коллег. Например, есть знаменитая гипотеза Пуанкаре, которую 2000 году включили в список задач тысячелетия. Сегодня она доказана, но даже среди опытных математиков со стажем далеко не каждый понимает это доказательство.

Поэтому не нужно знать всё. Главное — постепенно учиться и делать это с удовольствием.

Как говорить на одном языке с докторами наук

Сегодня приоткроем завесу тайны и поделимся первыми знаниями для вступления в математические ряды.

Неформальная математика в Data Science

Мы занимаемся аналитикой и бизнесом, поэтому наша математика тоже будет бизнес-аналитической: попробуем взять пользователей видеостриминга и посмотреть, как они выглядят на языке математических понятий и нотаций.

В нашем стриминге будет три зрителя: Толя, Миша и Ксюша. Все они сохранили себе в подборки по несколько фильмов.

  • Толя сохранил детективы: «Шерлок Холмс», «Китайский квартал» и «Особое мнение».
  • Миша смотрит фантастику: «Назад в будущее», «Гравитация», «Особое мнение» и «Планета обезьян».
  • Ксюша зарегистрировалась недавн э тех и успела добавить только один фильм — «Шерлок Холмс».

Подборки каждого зрителя на математическом языке будут называться множествами, а фильмы — элементами множеств. При записи всё содержимое множества помещается в фигурные скобки:

Неформальная математика в Data Science

Математически про наличие или отсутствие конкретного фильма в подборке одного из этих троих можно сказать так:

  • «Фильм “Китайский квартал” принадлежит множеству “Фильмы Толи”».
  • Или так: «Фильм “Касабланка” не принадлежит множеству “Фильмы Ксюши”».

Принадлежность или непринадлежность обозначается двумя символами, похожими на вилку: ∈ и ∉. Перечёркнутый символ означает, что такого элемента во множестве нет.

Неформальная математика в Data Science

Есть ещё знаки, которые часто используются при работе со множествами. Они выглядят как подковы и обозначают объединение, пересечение и подмножество: ∪, ⋂ и ⊂.

Объединение (∪) означает общий набор элементов из разных множеств. Например, так будет выглядеть объединение фильмов Миши и Ксюши:Фильмы Миши ∪ Фильмы Ксюши = {Назад в будущее, Гравитация, Особое мнение, Планета обезьян, Шерлок Холмс}

Пересечение (⋂) в нашем видеостриминге означает фильмы, которые есть в подборках сразу у нескольких человек. Пересечение множеств Толи и Миши обозначается так:Фильмы Толи ⋂ Фильмы Миши = {Особое мнение}.

Подмножество (⊂) показывает, что все фильмы из одной подборки есть и в другой. Подборка Ксюши целиком входит в подборку Толи:Фильмы Ксюши ⊂ Фильмы Толи.

Неформальная математика в Data Science

Из подобных знаний об аудитории потом получаются наборы информации, которые инженеры данных обработают и отдадут специалистам из Data Science, которые посмотрят и скажут: «Ага, в подборки 47% зрителей входит подмножество старых фильмов Гая Ричи. Что бы нам с этим сделать?»

После этого агенты стриминга звонят агентам Гая Ричи и подписывают с ним контракт на новый фильм в старом стиле. Сделки на миллион долларов, новые шедевры индустрии — и всё благодаря математике.

Конечно, для полноценной работы с большими данными нужно узнать ещё много инструментов, но их тоже можно постепенно изучить.

Что ещё интересного в математике

Даже если продолжить говорить только про теорию множеств, можно рассказать ещё много интересного. Например, про бесконечности разного размера.

Или про то, как превратить круг в треугольник и обнаружить, что их площади считаются по одной и той же формуле.

А как вам такая задача: найдите простую работающую инструкцию для сбора самых нужных вещей в рюкзак для путешествий — чтобы и перевеса не было, и все вещи были как можно более ценными. Найдёте решение — получите премию в миллион долларов от математического института Клэя.

Неформальная математика в Data Science

Сложной математике на простом языке мы обучаем всех желающих на бесплатном курсе «Математика для Data Science с нуля».

Если хотите подготовить себя к работе с большими данными, разбираться в сложных обозначениях или просто перестать бояться учёного языка — приходите к нам!

Мы научим:

3333
реклама
разместить
18 комментариев

Комментарий удалён модератором

Вы предлагаете ступить на тонкий лёд! Сразу несколько флешбеков подступает

о, такая математика мне нравится!

2

Спасибо! Нам тоже)

Комментарий удалён модератором

Минималистичный, да!

Раскрывать всегда
Спарсил 240к курсов Udemy и вот что выяснил

Привет! Я Илья, и у меня странное хобби — собирать и анализировать данные, которые никому не нужны. Иногда в этом процессе попадаются действительно интересные вещи, которыми не стыдно поделиться.

66
реклама
разместить
«9 из 10 стоматологов» и прочая брехня. Уловки с цифрами, на которые уже почти никто не клюёт

Вообще цифры — это здорово. Они помогают превращать всякие «непревзойдённое качество» и «мгновенный результат» во что-то более конкретное. Но бывает так, что именно из-за манипуляций с цифрами человек ловит себя на мысли: «Кажется, меня пытаются надуть».

«9 из 10 стоматологов» и прочая брехня. Уловки с цифрами, на которые уже почти никто не клюёт
66
[Давай общаться] - Тони Старк и Инсен в фильме "Железный человек"

Введение

Как разработчику стать AI-разработчиком в 2025?

Поздравляю, вы уже AI разработчик.

Как персонализированные рекомендации в EdTech повышают вовлеченность и выручку

Есть вопросы, которые волнуют человечество веками: «Есть ли высший разум?», «В чем смысл жизни?», «Как выполнить KPI по выручке?». И если на первые два ответа все еще нет, то на третий, возможно, появился интересный экспериментальный результат.

11
Большие данные (Big Data): как приручить гиганта и заставить его работать на ваш бизнес
Большие данные (Big Data): как приручить гиганта и заставить его работать на ваш бизнес
11
Причины низкого дохода
Причины низкого дохода
Люди больше не нужны? Профессии, которые уже заменил ИИ
Люди больше не нужны? Профессии, которые уже заменил ИИ

2023 - 2024 годы стали переломными для искусственного интеллекта. Развитие технологий ускорилось, а внедрение нейросетей затронуло буквально все сферы жизни. Мощные мультимодальные модели, такие как GPT-4 от OpenAI и Gemini Ultra от Google, теперь способны анализировать не только текст, но и изображения, аудио, код и даже сложные бизнес-данные.

11
Нужно ли будет знание программирования в эпоху искусственного интеллекта?

Сейчас все больше распространяется мнение, что не нужно. Билл Гейтс — не последний человек в мире технологий, да и ИИ, визионер и технооптимист – ответил на вопросы в рамках презентации своей книги «Исходный код». И его ответы отнюдь нетривиальны, аргументация – убедительна (по крайней мере, для меня).

Билл Гейтс и Пол Аллен (сидят) у телетайпа во время учебы в школе Лейксайд. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.axios.com%2F2025%2F02%2F03%2Fbill-gates-coding-matters-generative-ai&postId=1791360" rel="nofollow noreferrer noopener" target="_blank">Источник</a>. <br />
33
реклама
разместить
Нейросети в финансах: будущее уже здесь

Вы заметили, как искусственный интеллект незаметно, но уверенно проникает в нашу жизнь? В мире финансов всё чаще звучат прогнозы: через пару лет рутинные задачи вроде подготовки отчетности, моделирования, бюджетирования и базового анализа будут отданы на откуп ИИ-приложениям. Линейные финансисты, привыкшие к Excel и простым расчетам рискуют остатьс…

22
Попробуй решить эти 5 задач на Python

Эти задачи прокачают твоё логическое мышление, внимание к деталям и помогут взглянуть на язык под новым углом. Вместо стандартных примеров вроде «разверни строку» или «посчитай сумму массива» – задачи, которые действительно интересно решать.

[]