Машинное обучение: ожидания vs реальность

Привет, меня зовут Саша Гришин, я инженер в центре искусственного интеллекта компании Samsung и хочу поделиться с вами своим опытом: как выглядит машинное обучение в реальной жизни и в чём практика расходится с ожиданиями.

В закладки

Три года я не мог пройти даже заочный этап, но всё же решил не сдаваться и, наконец, поступил. Что интересно, в Школе после этого я учился на отлично. В процессе обучения моя мотивация росла, и по мере того, как я получал знания и общался с практикующими первоклассными специалистами, я чувствовал себя всё более уверенно, а желание развиваться в этой сфере становилось всё более сильным и осознанным.

В машинное обучение я пришёл не сразу. Окончив МФТИ по специальности «Прикладные математика и физика», сначала я занялся биоинформатикой и устроился в лабораторию системной биологии родного вуза. Там мы анализировали человеческий геном с помощью методов машинного обучения.

Тогда я понял, что это моё. Мне захотелось развиваться в этой сфере, но для этого не хватало навыков в математике и программировании. Поначалу я не понимал, где взять эти знания. Я проходил онлайн-курсы, но этого мне было мало: без живого общения с единомышленниками разобраться в новых дисциплинах было достаточно сложно.

Мой выбор остановился на Школе анализа данных Яндекса, где я мог получить не только теоретические знания, но и практические навыки. Конечно, не обошлось и без сложностей. Три года я не мог пройти даже заочный этап, но всё же решил не сдаваться и, наконец, поступил. Что интересно, в Школе после этого я учился на отлично. В процессе обучения моя мотивация росла, и по мере того, как я получал знания и общался с практикующими первоклассными специалистами, я чувствовал себя всё более уверенно, а желание развиваться в этой сфере становилось всё более сильным и осознанным. Тем более что мне удавалось находить время не только на плотный учебный график, но и на общение с однокурсниками.

Увлечение машинным обучением уже на втором курсе Школы привело меня в научную группу Дмитрия Петровича Ветрова, в которой я вплотную занялся нейросетями и байесовскими методами анализа данных.

Не всегда мои ожидания совпадали с реальностью. Но это меня не расстраивало. Более того, новые открытия делали работу ещё интереснее.

Да, возможностей здесь много, но много и людей, которые прямо сейчас к ним присматриваются и готовы опередить тебя в любой момент.

Факт 1

Когда только знакомишься с этой дисциплиной, кажется, что перед тобой открывается огромный фронт научной работы. Что есть огромное количество разных областей и тем, которых с избытком хватит и тебе, и твоим коллегам. Но стоит лишь начать развивать новую идею и начать её развивать, как обязательно выйдет статья на ту же тему, где все её аспекты уже раскрыты. Да, возможностей здесь много, но много и людей, которые прямо сейчас к ним присматриваются и готовы опередить тебя в любой момент.

Факт 2

Как в теории должно работать машинное обучение? Ты строишь гипотезы и приходишь к выводу, что определённый метод хорошо подходит для обработки твоих данных. Применяешь его, получаешь интересные результаты и таким образом решаешь свою задачу. В жизни всё по-другому. Гипотеза почти наверняка не сработает, а если она всё же окажется верна, ты будешь не радоваться этому, а искать ошибки, объясняющие такое невероятное везение. В академическом машинном обучении это нормально, если большинство твоих методов работают не так, как ты ожидаешь. К тому же научный сотрудник должен всегда подвергать сомнению свои субъективные суждения, а не принимать их за аксиому.

Факт 3

Казалось бы, машинное обучение — молодая дисциплина, которая сейчас проходит этап становления и взрывного роста. Но на практике обычно оказывается, что «сверхсовременные» технологии и методы уже давно придуманы и описаны в статьях 70-х или 80-х годов.

Факт 4

Множество знаковых научных работ и перспективных методов исходят не из Стэнфорда, Беркли и других ведущих вузов, а из крупных корпораций, таких как Google и Facebook. Эта тенденция характерна именно для машинного обучения и стала заметна лишь три–пять лет назад.

Факт 5

Когда я начинал писать статьи и отправлять их на крупные конференции, мне почему-то казалось, что рецензии на мои работы будут писать умудрённые опытом специалисты, которые отлично разбираются в машинном обучении и готовы дать строгую, но максимально объективную оценку. На самом же деле там сидят такие же молодые специалисты со своими научными интересами и далеко не всегда идеальным знанием темы. Поэтому в рецензиях часто попадаются замечания, которых совсем не ожидаешь. Так что приходится учиться максимально ясно и аккуратно излагать мысли.

Факт 6

Ещё одно заблуждение связано непосредственно с результатами машинного обучения. Например, представим, что нужно создать человекоподобного робота с 20 степенями свободы и научить его быстро бегать. Ты используешь современные методы, разрабатываешь алгоритмы обучения и ожидаешь, что робот будет проходить стометровку, двигаясь, как олимпийский чемпион. Но в реальности всё будет иначе. Он, конечно, будет бегать быстро, но его движения будут выглядеть крайне необычно. Робот будет без видимых причин размахивать рукой, подёргивать ногами и совершать другие действия, странные с точки зрения человека.

Факт 7

Болезненное столкновение с реальностью может ожидать специалиста по машинному обучению и при выполнении корпоративных заказов. Перед тобой ставят задачу, ты выбираешь лучшие методы её решения, планируешь работу и, уже предвкушая отличные результаты, говоришь заказчику: «Да, всё получится, сделаем по высшему разряду, но для этого нам нужно получить несколько десятков или лучше сотен тысяч примеров». А тебе отвечают, что есть только 300, максимум 500 объектов. Так что амбициозные планы приходится корректировать, исходя из реальных условий.

Факт 8

Обычно для машинного обучения надо выделить признаки объектов, чтобы определять их классы. Например, признаками дома могут быть количество этажей и комнат, площадь и высота. Когда я работал над одним из своих первых проектов в этой сфере, один из признаков я назначил совершенно неправильно. Грубо говоря, вместо комнат я рассчитал, сколько в доме жёлтых стен, умножил это число на три и вычел из него количество стульев. Но в результате алгоритмы всё равно работают! Поначалу это просто поражает. Однако в этом эффекте иногда кроется большая опасность, потому что из-за него бывает трудно понять, что ты где-то ошибся.

Факт 9

Одно время я работал в компании, которая разрабатывает технологии искусственного интеллекта в области медицины. Когда я туда устраивался, я думал, что там я буду круглосуточно участвовать в создании новых препаратов и лечении людей. Но вместо этого больше половины времени уходило на разработку инфраструктуры для экспериментов, подготовку данных и другие «бытовые» задачи. Конечно, в этом нет ничего плохого, и заниматься этим тоже интересно, просто не стоит слишком сильно романтизировать ожидания от работы.

Факт 10

С приходом нейросетей и глубинного обучения даже самые крупные и известные лаборатории стали страдать от недостатка вычислительных ресурсов. Особенно, если речь идёт о научной работе, где надо пробовать разные методы и параметры, постоянно меняя условия экспериментов. Казалось бы, распределить мощности не так сложно, как решать глобальные технические задачи, которыми мы занимаемся. Но всё же эта проблема оказывается самой острой и вызывает много конфликтов.

Факт 11

Поначалу я думал, что машинное обучение — достаточно строгая дисциплина. Ведь оно основано на высшей математике, количественном анализе и других точных науках. Поэтому было бы логично предположить, что и здесь подходы к решению задач будут стройными и понятными. Однако это верно лишь отчасти. Во многих случаях, особенно при работе с нейросетями и глубинным обучением, мы имеем дело в первую очередь с экспериментальными методами — как в физике, а не в математике. Большую часть времени ты не составляешь формулы, а ставишь опыты, смотришь на результаты, выдвигаешь гипотезы, проводишь новые испытания и чаще всего никак не можешь просчитать, что получится в итоге.

Все эти примеры показывают, что работа в области машинного обучения может сильно не соответствовать ожиданиям. Но это даже хорошо. Когда сталкиваешься с чем-то принципиально новым, ты всегда идёшь навстречу неизвестности. Иногда тебя ждут приятные сюрпризы, иногда — не очень. Но в любом случае ты открываешь для себя новый мир, и эта магия не перестаёт тебя вдохновлять.

Материал опубликован пользователем. Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Александр Гришин", "author_type": "self", "tags": [], "comments": 3, "likes": 19, "favorites": 23, "is_advertisement": false, "subsite_label": "life", "id": 66193, "is_wide": false, "is_ugc": true, "date": "Tue, 30 Apr 2019 16:52:18 +0300" }
{ "id": 66193, "author_id": 290569, "diff_limit": 1000, "urls": {"diff":"\/comments\/66193\/get","add":"\/comments\/66193\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/66193"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199123, "last_count_and_date": null }

3 комментария 3 комм.

Популярные

По порядку

1

о спасибо автору, очень интересно

Ответить
0

Факт 1

кажется

Класс :)

Ответить
0

Пусть перейдет в альфа зеру.

Ответить
0
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } } ]
Голосовой помощник выкупил
компанию-создателя
Подписаться на push-уведомления
{ "page_type": "default" }