Шаг к безопасным и надежным автопилотам для полетов произошел с помощью ИИ

Новый подход на основе искусственного интеллекта к управлению автономными роботами удовлетворяет сразу двум разнонаправленным целям: безопасности и стабильности.

Шаг к безопасным и надежным автопилотам для полетов произошел с помощью ИИ

В фильме «Маверик» герою, которого играет Том Круз, поручено обучить молодых пилотов выполнять, казалось бы, невыполнимую миссию — направлять самолеты глубоко в скалистый каньон, оставаясь настолько близко на земле, что их нельзя обнаружить с помощью радара, а затем быстро вылезть из каньона под экстремальным углом, избегая скалистых стен. Спойлер: с помощью Маверика эти пилоты выполняют свою миссию.

Теперь посмотрим, как эту задачу видит автопилот

Например, для простейшего автономного самолета самый легкий путь к цели противоречит тому, что машина должна сделать, чтобы избежать столкновения со стенами каньона или оставаться незамеченным. Многие существующие методы ИИ не могут преодолеть этот конфликт, известный как проблема стабилизации и предотвращения, и не смогут безопасно достичь своей цели.

Исследователи Массачусетского технологического института разработали новый метод, который может решить сложные проблемы стабилизации и избегания лучше, чем другие методы. Их подход к машинному обучению соответствует или превосходит уровень безопасности существующих методов, обеспечивая десятикратное повышение стабильности, что означает, что агент достигает и остается стабильным в своей целевой области.

В эксперименте, который заставил Маверика гордиться собой, их техника просто и без пилотов спилотировала бы смоделированный реактивный самолет через узкий коридор, не врезаясь в землю.

Это давняя, сложная проблема. Многие люди смотрели на это, но не знали, как справиться с такой высокоразмерной и сложной динамикой

Чучу Фан, доцент Уилсона по аэронавтике и астронавтике, член Лаборатории

Проблема стабилизации и избеганий

Многие подходы решают сложные проблемы стабилизации, упрощая систему, чтобы они могли решить ее с помощью простой математики, но упрощенные результаты часто не выдерживают реальной динамики.

Более эффективные методы используют обучение с подкреплением, метод машинного обучения, при котором агент учится методом проб и ошибок с вознаграждением за поведение, которое приближает его к цели. Но здесь действительно есть две цели — оставаться стабильными и избегать препятствий — и найти правильный баланс утомительно.

Исследователи Массачусетского технологического института разбили проблему на два этапа. Во-первых, они переформулируют задачу стабилизации и избегают как ограниченную задачу оптимизации. В этой настройке решение оптимизации позволяет агенту достичь своей цели и стабилизировать ее, что означает, что он остается в определенном регионе. Применяя ограничения, они гарантируют, что агент избегает препятствий, объясняет Так.

Затем на втором этапе они переформулируют эту ограниченную задачу оптимизации в математическое представление, известное как форма эпиграфа, и решают ее с помощью алгоритма глубокого обучения. Форма эпиграфа позволяет им обойти трудности, с которыми сталкиваются другие методы при использовании обучения с подкреплением.

"Но глубокое обучение с подкреплением не предназначено для решения эпиграфической формы задачи оптимизации, поэтому мы не могли просто подключить ее к нашей проблеме. Мы должны были получить математические выражения, которые работают для нашей системы. Как только у нас появились эти новые производные, мы объединили их с некоторыми существующими инженерными трюками, используемыми другими методами", — говорит Со.

Здесь нет приза за второе место

Чтобы проверить свой подход, они разработали ряд контрольных экспериментов с различными начальными условиями. Например, в некоторых симуляциях автономный агент должен достигать и оставаться внутри целевой области, совершая резкие маневры, чтобы избежать препятствий, которые находятся на пути столкновения с ним.

В этом видео показано, как исследователи использовали свою технику для эффективного полета на смоделированном реактивном самолете в сценарии, когда ему пришлось стабилизироваться до цели вблизи земли, сохраняя при этом очень низкую высоту и оставаясь в узком коридоре полета.

По сравнению с несколькими исходными тестами их подход был единственным, который мог стабилизировать все траектории при сохранении безопасности. Чтобы продвинуть свой метод еще дальше, они использовали его для полета на смоделированном реактивном самолете в сценарии, который можно увидеть в фильме «Top Gun». Самолет должен был стабилизироваться до цели вблизи земли, сохраняя при этом очень низкую высоту и оставаясь в узком коридоре полета.

Эта смоделированная модель реактивного самолета была разработана с открытым исходным кодом в 2018 году и была разработана экспертами по управлению полетом в качестве испытания. Могут ли исследователи создать сценарий, по которому их контроллер не сможет летать? Но модель была настолько сложной, что с ней было трудно работать, и она все еще не могла справиться со сложными сценариями, говорит Фан.

Контроллер исследователей Массачусетского технологического института смог предотвратить крушение или застойку самолета, стабилизируя цель гораздо лучше, чем любой из исходных условий.

В будущем этот метод может стать отправной точкой для разработки контроллеров для высокодинамичных роботов, которые должны соответствовать требованиям безопасности и стабильности, таких как беспилотники автономной доставки. Или он может быть реализован как часть более крупной системы. Возможно, алгоритм активируется только тогда, когда автомобиль катается по заснеженной дороге, чтобы помочь водителю безопасно вернуться к стабильной траектории.

Навигация по экстремальным сценариям, с которыми человек не сможет справиться, — это то, где его подход действительно сияет, добавляет.

"Мы считаем, что цель, к которой мы должны стремиться как на месте, заключается в том, чтобы дать усилению, изучая гарантии безопасности и стабильности, которые нам понадобятся, чтобы предоставить нам уверенность при развертывании этих контроллеров в критически важных системах. Мы считаем, что это многообещающий первый шаг к достижению этой цели", — говорит он.

Двигаясь вперед, исследователи хотят улучшить свою технику, чтобы она могла лучше учитывать неопределенность при решении проблемы оптимизации. Они также хотят исследовать, насколько хорошо работает алгоритм при развертывании на оборудовании, так как будут несоответствия между динамикой модели и динамикой в реальном мире.

"Команда профессоров болельщиков улучшила производительность обучения с подкреплением для динамических систем, где безопасность имеет значение. Вместо того, чтобы просто достичь цели, они создают контроллеры, которые гарантируют, что система может безопасно достичь своей цели и оставаться там на неопределенный срок", — говорит Стэнли Бак, доцент кафедры компьютерных наук Университета Стоуни-Брук, который не участвовал в этом исследовании. «Их улучшенная формулировка позволяет успешно создавать безопасные контроллеры для сложных сценариев, включая 17-стоятельную нелинейную модель реактивного самолета, частично разработанную исследователями из Исследовательской лаборатории ВВС (AFRL), которая включает в себя нелинейные дифференциальные уравнения с таблицами подъема и перетаскивания».

Исследование MIT

PS. лайк, пожалуйста, он помогает продвижению статьи.

Ну и как положено на VC, канал телеграм))) Канал и чатик

Туда выкладываю статьи VC и то, что нет в VC. Мысли, идеи, опыт.

В закрепленных канале всегда телеграм боты Kolersky для доступа в ChatGPT, GPT-4 без VPN, а так же генераторы изображений Midjourney, Dall-e, Stable Diffusion+ (все проекты: KolerskyAI).

1111
7 комментариев

Е..л я быть пассажиром в самолетике на картинке.

2
Ответить
1
Ответить

😂😂😂😂

Ответить

С этими пассажирами никто не сравнится

Ответить

ну вот есть же польза от ии, чего все так начинают переживать по поводу его использования.

Ответить

мы объединили их с некоторыми существующими инженерными трюками

Звучит надёжно.

Ответить