Пять научных
дисциплин: чему учиться,
чтобы менять будущее

Есть ряд технологий, которые уже сейчас меняют мир. Большие данные, робототехника, метаматериалы, интернет вещей, искусственный интеллект. На короткой дистанции понять, к чему они приведут — сложно. В совместном проекте со Сколтехом мы объясняем их суть, и рассказываем, что они дадут бизнесу.

В Сколтехе развивают искусственный интеллект, разрабатывают новые материалы и проектируют роботов. И не только.

Большие данные

Коммерческий анализ данных начался со сбора и хранения разнородной информации — в основном о пользовательских профилях и транзакциях. Эти данные собирались в неструктурированном виде, и, поскольку пользователей различных интернет-сервисов много, то и данных много. Они занимают большой объём памяти, кроме этого, к ним нужен быстрый доступ.

Евгений Бурнаев
Кандидат физико-математических наук, доцент магистерской программы Наука о данных Сколтеха, руководитель научной группы Advanced Data Analytics in Science and Engineering (ADASE)

Big Data — это коммерческий термин, «упаковка» определенного набора технологий, придуманная для того, чтобы их было удобнее продавать компаниям. На самом деле размер данных не так важен. Важно то, ради чего их собирают и для чего используют.

Компании построили хранилища, которые удовлетворяют этим требованиям. А потом, прикрутив несложную пользовательскую аналитику, обнаружили, что в этих данных можно находить поведенческие паттерны и, например, рекомендовать людям покупки, которые им потенциально интересны. Это помогло получать дополнительную прибыль и окупать затраты на внедрение систем хранения и обработки данных.

Более продвинутые методы машинного обучения можно использовать для более сложных задач — например, для разработки экономической стратегии и прогнозирования рисков.

Рассмотрим пример обработки больших разнородных данных в экономике. Стандартным инструментом предсказания финансовых показателей, таких как волатильность доходности активов и уровень цен на углеводороды, является технический анализ на основе статистических моделей и различных макроэкономических данных. Дополнительными источниками информации могут служить публикации в новостных ресурсах, социальных сетях и медиа, аналитические отчеты — потоки разнородных текстовых данных.

Действительно, на локальные колебания финансовых показателей влияют различные события: политические решения, забастовки рабочих, теракты. Когда о подобных новостях узнают трейдеры, на бирже начинаются значительные колебания цен. Автоматизированное определение тематики, оценка тональности и достоверности этих текстовых данных, а также извлечение из них именованных сущностей, фактов и событий помогает обогатить дополнительными факторами предсказательные модели и существенно улучшить оценку рисков тех или иных финансовых решений.

Аналогичная потребность — обработка потока разнородных данных — возникает и в технических приложениях, связанных с интернетом вещей. Например, на крупных автомагистралях работают погодные станции, которые собирают данные о скорости и направлении ветра, давлении, температуре воздуха и влажности.

В этих данных, во-первых, можно обнаруживать аномалии, которые означают, что какие-то датчики вышли из строя. Во-вторых, на основе собранной информации можно строить алгоритмы прогноза температуры поверхности дорожного полотна. Они позволяют прогнозировать обледенение в зимнее время и сейчас активно используются компанией «Минимакс»: научная группа Сколтеха ADASE (Advanced Data Analytics in Science and Engineering) работает с компанией над соответствующим проектом.

Для решения подобных задач мы активно используем современные подходы к глубинному обучению. Благодаря универсальности нейросетевых архитектур, нам удается строить алгоритмы, которые могут эффективно обрабатывать данные разного вида – графы, временные ряды, сигналы с лидаров.

В лаборатории мы разрабатываем новые методы машинного обучения для предсказательной аналитики и обнаружения аномалий, методов глубинного обучения для анализа 3D/4D данных, в том числе и медицинских (МРТ и фМРТ). Ещё мы сотрудничаем с рядом компаний, таких как Bosch, Huawei, «Газпромнефть НТЦ» и «Сбербанк». Спрос на приложения и наши разработки очень большой.

Уже сегодня методы машинного обучения и большие данные позволяют бизнесу:
Использовать более точные инструменты для оценки рисков и стратегического планирования экономики
Обрабатывать разнородные данные, делать прогнозы и оптимизировать процессы на их основе
Построить автоматических помощников — «второе мнение» — и сократить количество неэффективных решений
Искусственный интеллект вычислительных систем

Современные рекомендательные системы используют алгоритмы, в основе которых лежит матричный анализ. Это анализ двумерного массива данных: на одной оси расположены пользователи, на другой — продукты. Анализ становится сложнее, если массив данных многомерный, то есть состоит из трёх, четырёх и более ключевых параметров. Например, в случае рекомендаций это пользователи, фильмы и рейтинги фильмов.

Иван Оселедец
Доктор физико-математических наук, доцент магистерской программы Вычислительные системы в науке и технике Сколтеха, ведущий научный сотрудник Института вычислительной математики РАН

В 2009 году Иван Оселедец вместе с коллегами предложил метод упрощения многомерных массивов до матриц. Решение этой математической задачи на практике позволило улучшить рекомендательные сервисы — теперь алгоритмы стали не только предлагать похожие фильмы, но и учитывать негативный опыт: если пользователю не понравился «Крестный отец» — пускай посмотрит «Историю игрушек».

Рекомендательные алгоритмы Сколтех улучшает совместно с немецкой PrudSys, предлагающей решения для e-commerce и ритейла. В России Сколтех сотрудничает с «Яндексом», который использует их как в «Яндекс.Музыке», так и в «Яндекс.Маркете», и «Сбербанком».

Prudsys AG – это ведущий поставщик технологий искусственного интеллекта для торговли в разных каналах.

Основной продукт компании — программный продукт prudsys RDE, который автоматизирует процессы персонализации и ценообразования во всей цепочке формирования стоимости товара.

Новый метод разложения больших массивов можно использовать для решения разных задач в вычислительной химии, металлургии, авиамоделировании. По сути — везде, где результат определяется с помощью трёх и более параметров. Один из проектов Сколтеха, к примеру, посвящен повышению плодородия почв.

Это мобильная лаборатория: с её помощью можно отбирать и выполнять анализы на свежих образцах прямо в поле. Кроме того, это инструмент сбора больших данных — мобильная лаборатория позволяет быстро получить цифровую модель поля для анализа. Полученные данные можно использовать, например, для перепроектирования агротехнологий.

Эта сфера оказалась настолько востребованной, что выпускники программы сейчас запускают два стартапа: TensorFields для аудита агротехнологий на основе моделирования и машинного обучения, и второй, посвященный мониторингу, оптимизации и автоматизации в тепличных хозяйствах. Среди других возможных применений многомерных вычислений — оптимизация обслуживания пользователей в телекоммуникациях, а также ускорение моделей расчета нефтяных месторождений. У лаборатории есть совместные проекты с LG, Huawei и «Газпром нефтью».

В Сколтехе занимаются разработкой и совершенствованием алгоритмов глубинного и машинного обучения, нейронными сетями. Нейронные сети сейчас используются в основном для распознавания изображений, текста и аудио. Постепенно этим алгоритмам дадут решать более ответственные задачи: например, распознавать медицинские изображения, ставить диагнозы, оценивать кредитоспособность заемщиков и давать решение о выдачи кредита. Один из стартапов лаборатории уже предлагает диагностику стоматологических заболеваний по рентгеновским снимкам.

В будущем искусственный интеллект позволит бизнесу:
Точнее предсказывать предпочтения клиентов
Избегать ошибок, вызванных «человеческим фактором»
Улучшить алгоритмы поисковых систем
Цифровое проектирование и интернет вещей

Высокотехнологичные компании внедряют технологию применения «цифровых двойников». Эта технология подразумевает создание взаимосвязанных численных моделей каждого конкретного изделия, которые описывают его поведение на стадии испытаний, производства и эксплуатации. За счёт этого можно минимизировать количество физических испытаний, быстро оценивать эффективность модификаций, сокращать время от задумки до выпуска на рынок, а также использовать данные, собираемые в процессе эксплуатации для постоянного улучшения характеристик изделия.

Сергей Николаев
Научный сотрудник, кандидат технических наук, преподаватель магистерской программы Информационные и цифровые инженерные технологии Сколтеха

Интернет вещей позволяет собирать данные с объекта в режиме реального времени. Информацию о местоположении уже сейчас используют для улучшения логистики. Например, «Газпром нефть», с которой сотрудничает Сколтех, в феврале 2018 года завершила пилотный проект по отслеживанию с помощью GPS-меток поставок арматуры для платформы Приразломная в Печорском море.

Но логистикой интернет вещей не ограничивается. Результаты измерений с различных датчиков в реальном времени можно отправлять в качестве входных данных на виртуальную модель объекта и получить «цифровой двойник»: компьютерное представление физической системы, которое позволяет отслеживать его состояние.

Мониторинг условий эксплуатации изделия помогает предсказывать, когда нужен ремонт — например, ветрогенератору. Замена лопасти стоит очень дорого, но по показаниям датчиков на ветряке видно, какой нагрузке он подвергается. Если эту нагрузку приложить к виртуальной модели — «цифровому двойнику» ветрогенератора, — то можно спрогнозировать, когда именно понадобится профилактическое обслуживание и минимизировать потери, связанные с внеочередным ремонтом.

Наблюдение за несколькими тысячами однотипных объектов — к примеру, авиационными двигателями, — позволит находить и устранять уязвимости в конструкции. То, что теперь состояние изделия можно отслеживать во время его работы, уже изменило подход к проектированию. Современные PLM-системы позволяют сократить время разработки и избежать грубых ошибок проектирования: на численной модели сразу видны просчеты еще до натурных испытаний.

PLM-система — это система управления жизненным циклом изделия. В них хранится вся информация об изделии на этапе проектирования, производства и эксплуатации.

В Сколтехе студенты используют современное ПО для самых разных задач. Один из проектов — стратосферный беспилотник на солнечных батареях для раздачи интернета и дистанционного зондирования Земли. Другая разработка — дизайн-проект ионного двигателя для глубоких космических миссий. Третий — установка для десублимации углекислого газа на угольной электростанции, которая позволит охлаждать углекислый газ до состояния сухого льда и собирать его. Это разработка позволит серьезно сократить выбросы парникового газа.

В лаборатории интернета вещей Сколтеха датчики собирают и анализируют температуру воздуха, уровень кислорода и количество пыли. Когда параметры достигают критического значения — форточка лаборатории открывается, чтобы проветрить помещение.
В будущем технология создания цифровых двойников и интернет вещей позволит бизнесу:
Уменьшить сроки проектирования
Минимизировать количество ошибок при разработке
Быть уверенным в надежности сложных систем во время эксплуатации
Создавать принципиально новые изделия в энергетике, авиастроении и автомобилестроении
Робототехника

Роботы осваивают космос. Это безопаснее и дешевле: машинам не страшна радиация, не нужен кислород и вода. Автономность космических роботов, то есть их умение самостоятельно исследовать среду, принимать решения, обучаться, полезна и для решения бизнес-задач на производстве и в логистике.

Дмитрий Тетерюков

Руководитель лаборатории интеллектуальной космической робототехники, профессор магистерской программы Космические и инженерные системы Сколтеха

PhD в информационных науках и технологиях Токийского университета. С 2010 по 2014 годы возглавлял лабораторию в Технoлогическом университете Тоехаси, член IEEE (Институт инженеров электротехники и электроники)

В Сколтехе создают и развивают технологии для автономных многофункциональных роботов: техническое зрение, манипуляторы, интерфейсы для коллаборативных роботов и «очувствление роботов», искуственный интеллект. Например, в роботах команды reSet (трижды чемпион России в Eurobot) используются лидары и датчики приближения. Такой робот может точно позиционироваться на местности, избегать столкновения с препятствиями и манипулировать объектами в автономном режиме. Ожидается, что в будущем строительные роботы смогут ускорить и удешевить строительство домов при сохранении высокого качества.

Eurobot – это международные молодёжные робототехнические соревнования роботов.

Цель — привлечь школьников и студентов к работе над комплексными междисциплинарными проектами в области робототехники.

Каждый год у соревнования новая тема: например, в 2016 году были «Роботы на пляже». В 2017 году тема была «Город на Луне», а в 2018 — «Города-роботов. Строим лучший мир».

Роботы уже умеют работать в закрытых помещениях — например, осуществляют перемещение товара на складах. В распределительных центрах Amazon работают примерно сто тысяч роботов: это позволило повысить эффективность логистических операций на 20% и ускорить обработку заказов. В Сколтехе автоматизацией складов занимаются два стартапа: PickToGo, которые создают робота, способного распознавать коробки с товаром, собирать новую паллету и передвигать её в место погрузки; и WareVision, которые разрабатывают автономных дронов, считывающих штрих-коды и RFID-метки для инвентаризации склада.

Это открытая платформа OS:Car (Open Skoltech Car Platform) для сбора датасетов и проведения исследований в области беспилотного транспорта, созданная в Лаборатории робототехники Сколтеха. Перед началом движения студенты показывают стереокамерам, установленным на крыше автомобиля «шахматную доску»: для калибровки датчиков. OS:Car оснащен Лидаром Velodyne HDL-64E, стереокамерами Imagine Source, дифференциальным GPS и высокоточным инерциальным сенсором.
Аспиранты и руководитель Лаборатории Интеллектуальной
Космической Робототехники Дмитрий Тетерюков

Еще одно направление, которое развивают в Сколтехе, — это хаптика (haptics). Его суть — в передаче кинестетической информации: создание правдоподобных симуляций, когда объект виртуальной реальности можно не только увидеть, но и почувствовать. Эта технология наиболее перспективна для медицины — хирурги смогут обучаться, отрабатывая навыки не на живых пациентах, а виртуально.

Хаптика позволяет создавать интуитивно более понятные интерфейсы для управления роботами. Уже сейчас в лаборатории можно «почувствовать» рой дронов и управлять им более эффективно. Самих роботов тоже «очувствляют» — разрабатывают перчатку для «очувствлённого» управления роем дронов. Оператор может ощущать расстояние между роем и препятствием, а также динамическое состояние роя — расширение и сжатие.

Перчатка для «очувствленного» управления роем дронов. Оператор может ощущать расстояние между роем и препятствием, а также динамическое состояние роя (расширение и сжатие).

Это нужно для того, чтобы создать роботов, способных работать вместе с человеком и быть безопасными для него. На международной конференции IEEE ICRA 2018 будет представлена посадочная платформа DroneGear. Она позволяет мультикоптеру садиться на неровную, наклонную или подвижную поверхность. Роботизированные ноги адаптируются к любой форме поверхности и обеспечивают летательному аппарату (БПЛА) безопасную посадку.

В будущем робототехника позволит бизнесу:
Снизить травматизм на предприятии и создать безопасные условия работы
Увеличить производительность труда
Снизить стоимость производства
Оптимизировать работу складов
Ускорить доставку грузов
Дизайн новых
материалов

Раньше новые материалы открывали экспериментально, методом проб и ошибок. Многие материалы были открыты случайно: например, тефлон получился, когда учёные искали новый хладагент для холодильников. Такой метод — долгий, ресурсозатратный, дорогой и ненадежный. Но долгое время альтернативы ему не было.

Артём Оганов

Доктор физико-математических наук, профессор магистерской программы Материаловедение Сколтеха, PhD по кристаллографии Университетского колледжа Лондона, Dr.Hab. по кристаллографии ETH Zurich, с 2010 по 2017 год профессор Университета штата Нью-Йорк в Стоуни-Брук,член Европейской Академии Наук, профессор РАН

Тефлон — материал, который в основном применяется в производстве химической и бытовой посуды.

Также используется для производства мембранной одежды, в медицине, в транспортных средствах, в военных целях, в химической, электротехнической и пищевой промышленности.

Кристаллограф Артем Оганов разработал метод для предсказания структуры вещества при определенных условиях (давлении и температуре) — в случае, если заранее известно, из каких элементов вещество состоит. Это алгоритм USPEX, который используется в дизайне материалов.

Лаборатория Оганова в Сколтехе совершенствует алгоритмы с помощью методов машинного обучения и предсказывает новые материалы с требуемыми свойствами: например, термоэлектрические, магнитные и сверхтвердые материалы. Алгоритмы позволяют также найти лучшее сочетание сразу нескольких свойств материала — допустим, твердость и трещиностойкость. Для «Газпром нефти» лаборатория Оганова в Сколтехе создает сверхтвердые материалы для резцов бурового долота. По оценкам «Газпром нефти», новый материал мог бы снизить себестоимость бурения на 10-30%.

В лаборатории наноматериалов Сколтеха разрабатывают углеродные нанотрубки. Из них делают плёнку, которую будут использовать для производства гибких экранов.
Доска в лаборатории Оганова, на которой студенты фиксируют статус проектов и просто мысли. На кухне есть такая же, но на ней — рисунки с котом, страдающим от бессонницы.

USPEX может использоваться для поиска новых модификаций лекарственных препаратов. Также для медицинской 3D-печати нужны биосовместимые материалы — уже проводятся эксперименты по печати костей и вживлению их пациентам. За этим последуют зубы, мягкие ткани и органы. Предсказать биосовместимость на компьютере сегодня невозможно — но всё может быстро измениться.

В будущем дизайн новых материалов позволит бизнесу:
Создать новые материалы, в том числе устойчивые к радиации
Снизить износ деталей в сложных системах
Создавать новые сверхпроводники
Ускорить разработку лекарств
Сколтех готовит ученых, предпринимателей и специалистов в сфере высоких технологий. В Сколтехе делают особый акцент на инновационную деятельность и развивают шесть направлений:
Наука о данных и искусственный интеллект
Науки о жизни и биомедицина
Современные методы проектирования и перспективные материалы
Энергоэффективность
Квантовые технологии
Перспективные исследования
9
исследовательских
центров
>40
лабораторий,
оснащённых первоклассным
оборудованием
10
программ
магистратуры
7
программ
аспирантуры

В Сколтехе открыт набор на все магистерские программы до 16 июля.

Выпускники смогут построить успешную профессиональную или академическую карьеру и создать собственный наукоемкий бизнес.

Магистерские программы
Все программы имеют государственную аккредитацию. Выпускникам выдается диплом государственного образца.