Неформальная математика в Data Science

Зачем учить науку, за которую всё равно не дадут Нобелевку

Неформальная математика в Data Science

Привет, это karpov.courses!

Математики говорят и пишут на непонятном языке, стильно выглядят и раскрывают тайны Вселенной. Если вас тоже манит математика, но вы не знаете, как к ней подступиться, — читайте дальше.

О чём расскажем:

Почему так сложно

Математика много лет создавала себе имидж неприступной крепости и успешно отпугивала людей от работы мечты. «Нужна ли в Data Science математика» — один из самых популярных поисковых запросов про большие данные.

Для неподготовленного человека всё кажется страшным: формулы с непонятными обозначениями, абстрактные умозаключения, неочевидное применение в реальной жизни. Это выглядит так сложно, что даже Альфред Нобель не увидел ничего полезного и запретил давать свою премию за математические открытия.

Неформальная математика в Data Science

Если бы Нобель увидел сегодняшний мир, то, возможно, раскаялся бы. Шифрование частных данных, маркетинговые исследования, оценки скорости технических производств — всё это решают математики. А положенные на законы физики уравнения вообще описывают всё наше мироздание. Если не верите, почитайте или послушайте про теорию Янга — Миллса.

Практическое применение математике нашлось, но проще от этого она не стала.

Можно ли не отбить желание учить это всё

Если рассказать на человеческом языке какое-то сложное формальное математическое понятие, получится именно та наука, которая отпугивает почти всех заинтересовавшихся людей.

Чтобы упростить общение хотя бы между собой, математики придумали специальный язык — математические нотации. Они тоже выглядят непросто, но с ними все определения выглядят компактнее и позволяют учёным из разных стран понимать друг друга.

Неформальная математика в Data Science

Если разобрать хотя бы несколько математических символов, станет уже не так страшно. Даже в самой трудной формуле можно будет находить знакомые определения и примерно понимать, о чём речь.

И вообще, не понимать нормально. Даже сами математики часто не разбираются в работах своих коллег. Например, есть знаменитая гипотеза Пуанкаре, которую 2000 году включили в список задач тысячелетия. Сегодня она доказана, но даже среди опытных математиков со стажем далеко не каждый понимает это доказательство.

Поэтому не нужно знать всё. Главное — постепенно учиться и делать это с удовольствием.

Как говорить на одном языке с докторами наук

Сегодня приоткроем завесу тайны и поделимся первыми знаниями для вступления в математические ряды.

Неформальная математика в Data Science

Мы занимаемся аналитикой и бизнесом, поэтому наша математика тоже будет бизнес-аналитической: попробуем взять пользователей видеостриминга и посмотреть, как они выглядят на языке математических понятий и нотаций.

В нашем стриминге будет три зрителя: Толя, Миша и Ксюша. Все они сохранили себе в подборки по несколько фильмов.

  • Толя сохранил детективы: «Шерлок Холмс», «Китайский квартал» и «Особое мнение».
  • Миша смотрит фантастику: «Назад в будущее», «Гравитация», «Особое мнение» и «Планета обезьян».
  • Ксюша зарегистрировалась недавн э тех и успела добавить только один фильм — «Шерлок Холмс».

Подборки каждого зрителя на математическом языке будут называться множествами, а фильмы — элементами множеств. При записи всё содержимое множества помещается в фигурные скобки:

Неформальная математика в Data Science

Математически про наличие или отсутствие конкретного фильма в подборке одного из этих троих можно сказать так:

  • «Фильм “Китайский квартал” принадлежит множеству “Фильмы Толи”».
  • Или так: «Фильм “Касабланка” не принадлежит множеству “Фильмы Ксюши”».

Принадлежность или непринадлежность обозначается двумя символами, похожими на вилку: ∈ и ∉. Перечёркнутый символ означает, что такого элемента во множестве нет.

Неформальная математика в Data Science

Есть ещё знаки, которые часто используются при работе со множествами. Они выглядят как подковы и обозначают объединение, пересечение и подмножество: ∪, ⋂ и ⊂.

Объединение (∪) означает общий набор элементов из разных множеств. Например, так будет выглядеть объединение фильмов Миши и Ксюши:Фильмы Миши ∪ Фильмы Ксюши = {Назад в будущее, Гравитация, Особое мнение, Планета обезьян, Шерлок Холмс}

Пересечение (⋂) в нашем видеостриминге означает фильмы, которые есть в подборках сразу у нескольких человек. Пересечение множеств Толи и Миши обозначается так:Фильмы Толи ⋂ Фильмы Миши = {Особое мнение}.

Подмножество (⊂) показывает, что все фильмы из одной подборки есть и в другой. Подборка Ксюши целиком входит в подборку Толи:Фильмы Ксюши ⊂ Фильмы Толи.

Неформальная математика в Data Science

Из подобных знаний об аудитории потом получаются наборы информации, которые инженеры данных обработают и отдадут специалистам из Data Science, которые посмотрят и скажут: «Ага, в подборки 47% зрителей входит подмножество старых фильмов Гая Ричи. Что бы нам с этим сделать?»

После этого агенты стриминга звонят агентам Гая Ричи и подписывают с ним контракт на новый фильм в старом стиле. Сделки на миллион долларов, новые шедевры индустрии — и всё благодаря математике.

Конечно, для полноценной работы с большими данными нужно узнать ещё много инструментов, но их тоже можно постепенно изучить.

Что ещё интересного в математике

Даже если продолжить говорить только про теорию множеств, можно рассказать ещё много интересного. Например, про бесконечности разного размера.

Или про то, как превратить круг в треугольник и обнаружить, что их площади считаются по одной и той же формуле.

А как вам такая задача: найдите простую работающую инструкцию для сбора самых нужных вещей в рюкзак для путешествий — чтобы и перевеса не было, и все вещи были как можно более ценными. Найдёте решение — получите премию в миллион долларов от математического института Клэя.

Неформальная математика в Data Science

Сложной математике на простом языке мы обучаем всех желающих на бесплатном курсе «Математика для Data Science с нуля».

Если хотите подготовить себя к работе с большими данными, разбираться в сложных обозначениях или просто перестать бояться учёного языка — приходите к нам!

Мы научим:

3333
реклама
разместить
19 комментариев

Комментарий удалён модератором

Вы предлагаете ступить на тонкий лёд! Сразу несколько флешбеков подступает

о, такая математика мне нравится!

2

Спасибо! Нам тоже)

Комментарий удалён модератором

Минималистичный, да!