{"id":14284,"url":"\/distributions\/14284\/click?bit=1&hash=82a231c769d1e10ea56c30ae286f090fbb4a445600cfa9e05037db7a74b1dda9","title":"\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0444\u0438\u043d\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0430 \u0442\u0430\u043d\u0446\u044b \u0441 \u0441\u043e\u0431\u0430\u043a\u0430\u043c\u0438","buttonText":"","imageUuid":""}

Made: как это было глазами студента

Что такое Академия больших данных MADE и для кого она?

Сейчас 19:08, конец рабочего дня. Я начинаю писать эту статью, потому что сегодня должен сдать ее редакторам в Mail.ru Group. Почему-то все, что связано с Академией MADE, у меня ассоциируется с легкой болью и преодолением. Даже статья про нее. :) Благо боль эта приятная — как в мышцах после тренировки.

Академия MADE — это что-то вроде неофициальной магистратуры в области анализа данных и машинного обучения. Бесплатно, в формате «на выживание», на полтора года. Поступить сложно, учиться еще сложнее.

Для кого? С одной стороны, вроде как для всех, кто сдаст экзамены: со мной учились и студенты третьего-четвертого курса, и ребята старше меня (а мне 32). А с другой — это для тех, кто не ищет легких путей и готов идти по пути самурая, как называет это мой коллега по MADE Михаил. Больно сейчас, хорошо потом — это как раз именно такая история.

Как я поступал и что мне помогло

Так получилось, что я начал готовиться к поступлению за семь месяцев до экзаменов. Я тогда с трудом помнил, что такое производная и логарифм. Высшая математика была в университете больше десяти лет назад, а полноценных алгоритмов в моей жизни не было никогда. Максимум, что я делал, — писал рекурсию. Потом два года я писал на Java и пять-шесть лет занимался маркетингом, закупкой и аналитикой трафика.

MADE тогда еще не существовало, и я готовился к поступлению в ШАД. До экзаменов оставался один месяц. Его, конечно, не хватило на полноценную подготовку, и я не поступил. Я немного погрустил — и начал готовиться к следующему набору, который стартовал через год.

А через шесть месяцев открылся набор в Академию MADE. Это было неожиданно, и я думал, что еще не готов, но все-таки оставил заявку.

После семи месяцев подготовки пять-шесть дней в неделю по восемь-десять часов в день я каким-то чудом сдал экзамен по математике, решил контест по алгоритмам и занял 30 место из 527 в соревновании по анализу данных. Поступил!

Курсы и лекции, по которым я готовился:

  • Специализация от Яндекса и МФТИ «Машинное обучение и анализ данных» на Coursera
  • Курс «Линейная алгебра» от ВШЭ на Coursera
  • Курс «Основы статистики» от Карпова на Stepik
  • Курс "Algorithmic Toolbox" от университета Сан-Диего и ВШЭ
  • Курс «Алгоритмы: теория и практика. Методы» на Stepik
  • Курс «Комбинаторика для начинающих» от Райгородского (МФТИ) на Coursera
  • Курс «Нейронные сети и компьютерное зрение» от Samsung Research Center на Stepik
  • Лекции «Математический анализ» от Савватеева и Тониса на YouTube (без домашних заданий)

Ну и, конечно, http://mathprofi.ru, который выручал, когда я не мог что-то решить. :)

Из книг помню точно, что купил и заглядывал во «Введение в алгебру» Кострикина. Остальные брал в библиотеке ситуативно (кстати, да, эти семь месяцев я сидел и учился в библиотеке), и уже, к сожалению, не вспомню.

Думаю, что это далеко не идеальная программа. Все субъективно: кто-то сделает упор на книги и решебники, кто-то — на курсы, а кто-то, возможно, наймет репетитора. Тем более за два года могли появиться новые классные курсы и лекции. Но я уверен в одном: нужно решать задачи. Как бы ни хотелось идеально понять теорию, все же нужно решать. И именно это, а не зубрежка теории, помогает интуитивному пониманию.

Мозг ленивый и отлично скатывается в имитацию работы вместо реальной работы. Поэтому, если бы я мог дать себе какой-то совет, он был бы очень простой: решать больше задач. :)

Учеба: ожидания и реальность

Наш сын, которому было 6 месяцев, когда начали проходить нейросети, меня морально поддерживал и просил почитать «Neural Networks for Babies».

Я ожидал жесть — я получил жесть. Здесь все совпало.

Учеба у меня занимала в районе 30 часов в неделю. В основном время уходит на домашки, лекции можно смотреть на увеличенной скорости воспроизведения.

Когда я поступил, в тот же месяц мне предложили мою первую работу в сфере машинного обучения и у меня родился сын. Чем пришлось пожертвовать:

  • соцсетями: экранное время на телефоне драматически упало;
  • сериалами (всеми): успел посмотреть пару серий чего-то на зимних каникулах, и все;
  • общением с друзьями и тусовками: за полтора года учебы я выбирался к друзьям несколько раз, ненадолго;
  • сном: особенно ближе к концу семестра.

Но я учился хорошо. Если учиться «на троечку» и сдавать минимум, наверное, можно укладываться в заявленные 20 часов. Но это не точно.

Да, с одной стороны, конечно, было сложно. Но с другой — интересно. Соревнования — азартная штука, а часть домашек построена именно на них. И это не только классические Kaggle-соревнования, но и что-то экзотическое типа оптимизационных задач на графах или соревнований по сортировкам на алгоритмах. Или же это может быть классическое Kaggle-соревнование, но алгоритм ранжирования приходится писать самому с нуля.

Да и самые обычные домашки местами были просто огненные: раскодировать шифр с помощью MCMC-семплирования, обыграть казино в блэкджек, научив RL-алгоритм считать карты в колоде, собирать пятнашки с помощью графовых алгоритмов с эвристиками, написать свой PageRank на чистом C и распараллелить с OpenMP или закодить параллельное размытие картинки на чистой CUDA прямо на ядрах GPU.

И вместе с нейросетями, тоже начинается много всего интересного — от распознавания точек на лице и генерации подписей к картинкам до разных GANов. К примеру, наш выпускной проект генерировал картинку готовой еды по ингредиентам рецепта и описанию их приготовления. И местами получалось очень даже аппетитно. :)

Предметы, которые я сдавал

Семестр 1

  • Введение в алгоритмы и структуры данных
  • Машинное обучение
  • Advanced Python
  • Статистический анализ данных / Python

Семестр 2

  • Компьютерное зрение
  • Байесовские методы в машинном обучении
  • Дизайн и планирование экспериментов
  • Обработка естественного языка

Семестр 3

  • Машинное обучение на графах и анализ социальных сетей
  • Машинное обучение на больших данных
  • Высокопроизводительные вычисления
  • Анализ геоданных
  • Обучение с подкреплением и генеративные модели

Предметы, которые я оставил на середине, потому что понял, что больше не потяну:

  • методы оптимизации в машинном обучении;
  • нейробайесовские методы.

Последний семестр получился насыщенным, потому что у меня закончился годовой контракт на моей первой работе и я не стал его продлевать. Обычно бросают учебу ради работы, а у меня получилось наоборот. Но я считаю, что это того стоило на 100%.

Есть ли жизнь после MADE?

Интересное чувство, когда то, что отнимало практически все твое свободное время, резко заканчивается. Появляется легкое ощущение потерянности. Коллега по MADE Ксения очень символично назвала наш чатик выпускников "LOST. MADE 2019".

Потом понемногу начинаешь вспоминать, что когда-то ты отдыхал, ходил гулять, встречался с друзьями и даже позволял себе смотреть какой-нибудь совершенно тупой сериал. :)

Сначала я устроил себе отпуск месяца на полтора, а потом начал плавно соглашаться на собеседования. Кстати, собеседоваться после MADE — довольно приятное занятие. Если кратко, то мне сложно представить, чтобы у выпускника возникли сложности с поиском работы.

Всего у меня было пять треков собеседований. И в итоге я получил четыре оффера. Один из них каким-то странным образом даже на senior-позицию. В числе прочих я получил оффер и от Mail.ru Group. Туда и пошел.

Что дальше?

Уже месяц я работаю в команде антиспама. Теоретически в машинном обучении нас подготовили как минимум достаточно, и сейчас основную сложность для меня представляют инженерные задачи.

Когда через сервис проходят десятки тысяч писем в секунду, приходится в первую очередь думать не о метриках на лидерборде, а о том, что, если ты сделаешь что-то не то, то «повалит спам — и будет алярм». Или еще хуже — в спам станут попадать хорошие письма.

В общем, пока рано делать какие-то выводы, но с уверенностью могу сказать, что формат «сложно, но интересно» продолжается и здесь.

Если у меня не получилось вас запугать, то пробуйте поступить. И если поступите, вас ждет полтора незабываемых года учебы на максималках. Дерзайте!

0
5 комментариев
Kanski_LIVE

Читал статью ещё в твоём блоге,спасибо за дополненный отзыв. Учеба вместе с пополнением в семье это конечно лютый хардмод, мое уважение что справился👍

Ответить
Развернуть ветку
Алексей Ярошенко
Автор

Спасибо! Скорее, "справились", супруге доставалось не меньше :)

Ответить
Развернуть ветку
Дулат Орманов

Здраствуйте Алексей.Прежде всего спасибо за информативную статью!Не могли бы вы сказать как подготовиться к соревнованию по машинному обучению,должен ли я полностью проходить специализацию от курсера яндекс мфти»машинное обучение и анализ данных»?Можно ли я обойтись без pythonа если я знаю java?

Ответить
Развернуть ветку
Alexey Rumyantsev

Семь месяцев подготовки по 8-10 часов - получается в это время кроме подготовки ничем не занимались ? Хардкорно

Ответить
Развернуть ветку
Алексей Ярошенко
Автор

Да, свернул свои проекты по трафику, чтобы не отвлекали. Передал клиентов, с которыми тогда работал по трафику, коллегам. И готовился. Благо, такая возможность была. Думаю, можно было бы и без "сжигания мостов", тогда это просто заняло бы сильно больше времени. 

Ответить
Развернуть ветку
2 комментария
Раскрывать всегда