Как изучить математику для машинного обучения и анализа данных? Подборка книг для любого уровня
Если вы хотите всерьез заняться машинным обучением и анализом данных, без математики вам точно не обойтись. Но какие именно разделы вам понадобятся и как подступиться к ним, не имея опыта? Мы попросили Леонида Иосипоя, академического руководителя программы «Математика для анализа данных» Центра непрерывного образования ФКН ВШЭ, составить список книг, которые помогут изучить математику с любым уровнем подготовки.
Начальный уровень
Считается, что в машинном обучении и анализе данных необходимы три раздела математики: линейная алгебра, теория вероятностей и статистика и математический анализ. Если ваш уровень подготовки не позволяет вам изучать эти дисциплины, обратите внимание на обычные школьные учебники. Это неочевидное, но наиболее доступное решение, ведь они написаны простым языком и понятно объясняют сложные идеи.
- А. Мерзляк, В. Поляков. Алгебра. 9 класс
- А. Мерзляк, В. Поляков, Д. Номировский. Алгебра и начала математического анализа. 10 и 11 класс
- M. Spivak. The Hitchhiker's Guide to Calculus
- J. Stewart, L. Redlin, S. Watson. Precalculus: Mathematics for Calculus
Средний уровень
Если вы уже освоили (или освежили) базовые знания математики, можно переходить к более сложным вещам. Книги промежуточного уровня уже разделены на три части в соответствии с необходимыми разделами математики: матанализ, линейная алгебра и теория вероятностей. Наверняка вы заметили, что большинство книг в этом разделе — на английском языке. Ничего не поделаешь, в математике, как и в любой науке, подавляющее большинство книг и статей — на английском.
Математический анализ
- L. Tarasov. Calculus: Concepts for High School (на русском: Л. Тарасов. Математический анализ. Беседы об основных понятиях)
- J. Stewart. Calculus. Early Transcendentals
- S. P. Thompson. Calculus Made Easy
Линейная алгебра
- G. Strang. Introduction to Linear Algebra
- S. Axler. Linear Algebra Done Right
Теория вероятностей и статистика
- А. Шень. Вероятность: примеры и задачи
- S. M. Ross. Introduction to Probability Models
- К. Л. Чжун, Ф. АитСахлиа. Элементарный курс теории вероятностей
- D. Freedman, R. Pisani, R. Purves. Statistics
Продвинутый уровень
Наконец мы подошли к продвинутому уровню. Здесь уже меняется способ изложения материала — если в предыдущих книгах упор делался на простоту и понятность изложения, то теперь стиль стал больше похож на энциклопедию, где сведения излагаются кратко и по существу. Помимо трех предыдущих разделов математики мы добавили еще один — приложения математики в машинном обучении и анализе данных.
Математический анализ
- M. Spivak. Calculus
- В. Зорич. Математический анализ
- У. Рудин. Основы математического анализа
Линейная алгебра
- J. Hefferon. Linear algebra
- П. Халмош. Конечномерные векторные пространства
- А. Кострикин. Введение в алгебру. Часть 2. Линейная алгебра
- А. Гайфуллин, А. Пенской, С. Смирнов. Задачи по линейной алгебре и геометрии
Теория вероятностей и статистика
- В. Феллер. Введение в теорию вероятностей и ее приложения
- М. Кельберт, Ю. Сухов. Вероятность и статистика в примерах и задачах
- М. Лагутин. Наглядная математическая статистика
- G. Casella, R. Berger. Statistical Inference
Математика для машинного обучения и анализа данных
- M. Deisenroth, A. Faisal, C. Ong. Mathematics for Machine Learning
- G. Strang. Linear Algebra and Learning from Data
Дисклеймер: данный список ни в коем случае не является полным. Мы сознательно старались добавлять как можно больше нестандартных источников, так как стандартные и так всем знакомы. И, конечно, деление книг по уровню примерное: в книге среднего уровня могут быть темы продвинутого уровня и, наоборот, не все темы из книги продвинутого уровня являются действительно сложными.
Применительно к бизнесу, чтобы заниматься аналитикой и машинным обучением, в первую очередь нужно быть бизнесменом и/или хорошо понимать бизнес.
Если машинное обучение и/или аналитика в отраслях (медицина, машиностроение и пр), то в первую очередь нужно быть специалистом.
Во вторую очередь, желательно наличие учёной степени.
В третью очередь - опыт и понимание ИТ.
Сама по себе математика бессмысленна, если ты не способен применять аппарат.
И более того, современные технологии позволяют верхенуровнево подойти к решению вопросов, что более ценным делает понимание отрасли, нежели линейной алгебры.
"Сама по себе математика бессмысленна, если ты не способен применять аппарат."
Чел, ты точно из ds?
Что за обращение "чел"?? Вас на какой помойке нашли?? Разговаривать с людьми вас не научили??
+ Когда разговариваешь с людьми, не нужно переходить на личности, чтобы не получать вот такие вот комментарии в ответ.
Что касается комментария по существу, то если вы не понимаете почему я это написал, то может быть проблема в вас?? Может быть это вы плохой датасаентист??
И чтобы вы знали, я кандидат наук, руководил различными лабораториями, финалист конкурса Лидеры России по направлению Наука, имею награду РАН, и делал международный бизнес на нейронных сетях.
И то, что я написал - очевидные вещи для любого вменяемого человека, который хоть что-то да делал в наук.
"Что за обращение "чел"?? Вас на какой помойке нашли?? Разговаривать с людьми вас не научили??"
Обращение в соответствии с вашим коммюнике относительно математики.
Вам как кн поясню свою мысль глубже.
Есть машина, пусть это будет Камаз. Есть три уровня взаимодействия человечества с ней.
Водитель. Он им управляет. Рубит в общую физику, - как надо загружать, разгружать или как с подвижным грузом входить в резкий поворот. Умеет давить на кнопки и крутить руль. Знает ПДД. Может на слух диагностировать наличие или отсутствие проблем. Он пользователь.
Механик. Он не умеет водить. не знает ПДД. Ему класть на девиации раствора под действием центробежных и центростремительных сил.
Но он рубит в основах гидродинамики, теории металлов, базовой теории электродинамики. Может настраивать и ремонтировать сломанное. Он технолог
Инженер. Вот инженер должен быть в курсе всех вопросов и первого и второго чела, уметь рассчитывать и проектировать. То есть он тот кто строит систему. Чтобы построить ее - он должен придумать математическую модель всей физики взаимодействий машины с окружающим миром. Он конструктор.
И когда , кто то рассуждает, что математика в конструировании не нужна, то серьезней чем “челом” его представить тяжело.
Этот чел датасаентист в законе, ты не по понятиям обращаешься, пацаны с кафедры не поймут😂
Если честно, какую-то чушь написали, которая совершенно не связана с тем, что написал я.
Где я написал что математика не нужна?? Вы видимо прочитали по диагонали и не поняли суть.
А что касается вашего поведения, то видимо из тех, кто с волками по волчьи воет. Вы или человек, или дворняга. В любых условиях. Выбирать вам.
Чел, правда расслабься! Фотография в костюме не делает тебя важным, это интернет
Чел, расслабься
А что сейчас с этим международным бизнесом на нейронных сетях?
Закрыт на реорганизация в связи с развалом экономических связей и эквайринга. То, есть, деньги с клиентов не получить. И по сути все направления рухнули.
Я его делал из России, а стартап был международным. Поэтому я принял решение о реорганизации в разных смыслах этого слова.
Все наработки и достижения же есть. Переделаю и развернусь в немного другом виде/направлении.
Во вторую очередь, желательно наличие учёной степени.= Порвало и убило.
Комментарий недоступен
Да если честно, жертвам курсов не объяснишь. Они считают, что весь мир у их ног.
Я как то видел результат многолетний работы одного кандидата-математика. Три года работы - ноль результата. Слезинка из глаза и рученьки из жопы.
Потому что если человек не понимает область, то он будь хоть дважды доктором, но ничего не сделает.
Прекрасный тред - это как прийти на форум My chemical romance и писать что MCR не нужен, а эмо - говно и оправдывать наличием кандидатской по горюче-смазочным материалам. Потом каких-то джунов притянули - знаете, я еще глубже копну, джуну не только не нужна математика, потому что время тратить приходится, ему даже собеседования и работа не нужны, т. к. на них тоже время уходит, просто стипендия десяток килобаксов ему нужна, квартира, вилла и пара-тройка моделей в спортивной машине. Мало ли че ему нужно, его никто не спрашивает. N.B. Рубрика - "что почитать". Тема - книги по математике в ML.
Understanding Analysis S. Abbott и Introduction to Topology Gamelin/Greene очень хороши, раз уж до Зорича дошло. А раз Кострикина назвали, то и Винберга для общего развития рекомендую. Кстати книги Стрэнга примерно соответствуют двум видео курсам того же Стрэнга на OCW.
P.S. почему то вспомнилась легенда, как у Нобеля жена сбежала к математику, хм
Кому это нужно? Джуну? Ему нужно научиться проходить собеседование в части мат.вопросов и SQL. На освоение этого списка, даже частей, уйдут годы, которые можно потратить на более полезные для карьеры вещи. Туда, где нужно хорошее рабочее знание математики все равно зайдут профессионалы, которым этот список не нужен
А хотелось бы еще список стандартных книг. Я о них например не знаю
в очередной раз в неприятном удивлении от качества публикации от имени ВШЭ.
Пожалуйста, скажите, что писал иностранный студент, т.е. русский язык у него не родной. И тогда он просто умничка.
upd.
Ничего не поделаешь, в математике, как и в любой науке, подавляющее большинство книг и статей — на английском.bullshit
Давно ждал список