{"id":14294,"url":"\/distributions\/14294\/click?bit=1&hash=434adac65d5ae5d3e2e945d184806550325dd9068ef9e9c0681ca88ae4a51357","hash":"434adac65d5ae5d3e2e945d184806550325dd9068ef9e9c0681ca88ae4a51357","title":"\u0412\u043d\u0435\u0434\u0440\u0435\u043d\u0438\u0435 \u0418\u0418 \u043c\u043e\u0436\u0435\u0442 \u043f\u0440\u0438\u043d\u043e\u0441\u0438\u0442\u044c \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u044f\u043c \u043c\u0438\u043b\u043b\u0438\u0430\u0440\u0434\u044b \u0432 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

Артем Кривич

16 июн 2020 16.06.2020

Нужны ли лидары для self-driving и зачем мы определяем расстояния до объектов одной камерой

Лидар — это дорого. Даже учитывая их снижение стоимости за последние годы, они все равно остаются дорогими, а чтобы обвесить ими всю машину, как делает Waymo, придется заплатить в три раза больше, чем стоимость самого автомобиля. Так можно ли от них отказаться?

У технологии self-driving есть два подхода, первый, опробованный крупными игроками, (первые машины так ездили еще в далеком 2008), заключается в движении автомобиля по построенной 3D-карте. Именно для лучшей ориентации по этой карте и нужно большое количество лидаров. Чем их больше, тем точнее и… дороже. Второй способ основан на нейронных сетях, re-inforcement learning и сложной математике. И именно этим путем мы решили пойти в Ralient, в том числе потому что такой подход будет работать в сложных условиях. Эта область мало изучена, но позволяет значительно приблизить self-driving к реальному вождению в разных условиях. Тем не менее edge-кейсы (события, которые происходят на дорогах редко) все также остаются и с ними все также надо справляться.

Отказавшись от 3D-карт и лидаров мы отказались и от возможности лидарами определять объекты в 3D-пространстве, расстояния и их размеры. Поэтому одной из наших задач была разработка нейронной сети, которая сможет это делать и делать точнее, чем человек.

Разделять объект от фона по двум камерам научились уже достаточно давно. Но для селф-драйвинга очевидно этого не достаточно.

Мы разработали нейронную сеть, которая позволяет делать это с помощью всего одной камеры. В дальнейшем, используя две камеры мы еще увеличим точность. На видео, которое мы прикрепили ниже, вы видите работу нейронной сети на потоке с одной камеры. Нейросеть сейчас обучена только на автомобили.

Single-shot end-to-end monocular 3D object detection // Ralient

Подобной технологии сейчас нет ни у кого в мире. Что-то схожее есть у Тесла. Но они это делают с нескольких камер и радара.

Вот пример видео с Tesla.

При этом в нашем примере мы пока что не использовали трекшн объектов, то есть нейросеть обрабатывала каждый кадр без знаний о предыдущем. Это сделано для того, чтобы нейросеть на каждом кадре работала без ошибок.

Это позволит не только нам отказаться от лидаров, это позволит значительно упростить переоборудование машин в беспилотники и увеличить масштабы. Нам не нужно обучать машину ездить именно в вашем городе, не нужно строить 3D-модель вашего города. Мы просто отправим к вам беспилотник.

Так нужны ли лидары для self-driving?

Наш Twitter, мой Twitter, следите за нашим процессом работы.

7 показов

1.8K открытий

37 комментариев

Написать комментарий...

Anton Chigaev

16.06.2020

Достаточно окатить камеру лужей с грязью и привет

Ответить

Развернуть ветку

Артем Кривич

16.06.2020 Автор

Нет, наши нейросети довольно стабильны к легким искажениям картинки. Посмотрите эту статью, особенно видео со вторым кейсом https://vc.ru/transport/108004-kak-iskat-dorozhnuyu-razmetku-v-tom-chisle-esli-ee-net

Ответить

Развернуть ветку

Artem Petrenkov

16.06.2020

А лидары под дождём и снегом в принципе плохо работают: https://www.quora.com/Autonomous-driving-how-good-is-LiDAR-under-heavy-rain-or-fog

Autonomous driving: how good is LiDAR under…

Autonomous driving: how good is LiDAR under heavy rain or fog? - Quora

www.quora.com

Ответить

Развернуть ветку

Николай Морозов

16.06.2020

Как и люди.

Ответить

Развернуть ветку

Alexey Glazachev

17.06.2020

Выглядит здорово, но с точки зрения надёжности системы одна камера - маловато.

Ответить

Развернуть ветку

Артем Кривич

21.06.2020 Автор

Сейчас лучше подтверждать значения другим датчиком (напр. радаром или одним лидаром).

Ответить

Развернуть ветку

Тимур Иванов

20.06.2020

Зачем нужны лидары и прочие датчики, можно просто сделать Искусственный Интеллект, который сам будет распознавать объекты и определять расстояние до них. Изи же. Как Маск до этого не додумался.

Ответить

Развернуть ветку

Артем Кривич

21.06.2020 Автор

Удивительно, но Tesla ближе других работают именно в этом направлении. У остальных это просто робототехника.

Ответить

Развернуть ветку

Михаил Алекперов

17.06.2020

Почему, когда читаешь про машинное обучение, всегда кажется, что тебя дешево разводят?

Ответить

Развернуть ветку

Юрий Пашков

22.06.2020

Может, потому что Вы ничего в этом не понимаете?

Ответить

Развернуть ветку

Михаил Алекперов

22.06.2020

Боюсь, что достаточно понимаю, чтобы отличить подгон коэффициентов наугад и "построение моделей" от нормального ресеча. Математика для этих модных веяний создается совсем другими людьми, они не сидят в коворкингах со смузи, не обсуждают инвестиции на vc и вообще находятся за пределами РФ. Удел "машинообучальщиков" и прочих хайпожоров - пользоваться уже готовым инструментарием, не вдаваясь в его суть.

Ответить

Развернуть ветку

Артем Кривич

23.06.2020 Автор

Решил провести ресеч, как влияет процесс поглощения смузи/камбучи/прочего и работа в общественном месте (коворкинг закрыт к сожалению) на умственные способности. Как поеду в отпуск за пределы РФ - проведу еще один тест. Обязательно отпишусь)

Ответить

Развернуть ветку

Михаил Алекперов

23.06.2020

Да какой там отпуск, это EPFL.

École Polytechnique Fédérale de Lausanne

The École polytechnique fédérale de Lausanne (EPFL) is a research institute and university in…

en.wikipedia.org

Ответить

Развернуть ветку

Юрий Пашков

22.06.2020

Это отлично. Я исхожу из того, что одной камеры может быть достаточно, только из того, что водить автомобиль может одноглазый человек. Но необходимо иметь ещё как минимум акселерометр, для того, чтобы отличить информацию на горку какой-нибудь, например. А так-то все возможно. Насчёт хайподелов - они везде есть, в любой отрасли...

Ответить

Развернуть ветку

Аккаунт удален

22.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Юрий Пашков

22.06.2020

Вы ошибаетесь. То, что глаз поворачивается - никак не может решить проблему определения расстояния. Это может только решить проблему, сколько градусов обзора может дать глаз.

Ответить

Развернуть ветку

Аккаунт удален

22.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Артем Кривич

22.06.2020 Автор

К слову заметить мы не сидим в коворкингах, и проводим много ресеча и тестов. Если вам кажется что это так просто, это ошибочное мнение.

Ответить

Развернуть ветку

Юрий Пашков

22.06.2020

Не берите близко к сердцу. У человека просто стойкое отвращение к коворкингам, смузи и чизкейкам.
Как писал Пушкин, "Быть можно дельным человеком и думать о красе ногтей".
Но у некоторых - это все не так, и только в НИИ ЧАВО, прихлебывая капяток из железной трехсотграмовой кружки - можно разобраться в сути вещей. Но не сидя в коворкинге, со смузи. )))
Такие дела.

Ответить

Развернуть ветку

Юрий Пашков

22.06.2020

А всем же нужно именно не пользоваться инструментами, а заниматься велосипедостроением? Чтобы, так сказать, уже разобраться, так разобраться. Написать компилятор, чтобы уже наверняка все...
Эти времена давно прошли, хочу Вас огорчить. Вы живёте иллюзиями.
Много ваших операционок в продакшене по всему миру? Компиляторов?
Или Вы таки пользуетесь какими-то инструментами?
Где грань, разбирается или нет человек в том, как работает инструмент? По Вашему определению? Сидит в коворкинге - значит не разбирается.)) Хайпует небось.

Ответить

Развернуть ветку

Михаил Алекперов

22.06.2020

Я говорю про пафос, с которым преподносится машинное обучение.
Применение хайповой техногии автоматически прибавляет +100 к ЧСВ, хотя на деле это обычная рутина.

Ответить

Развернуть ветку

Михаил Алекперов

22.06.2020

Про компилятор плохой пример. Эта такая штуковина, которую в одну морду не напишешь.

Ответить

Развернуть ветку

Аккаунт удален

16.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Аккаунт удален

21.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Артем Кривич

21.06.2020 Автор

Пожалуйста, перечитайте статью.

Ответить

Развернуть ветку

Аккаунт удален

22.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Артем Кривич

22.06.2020 Автор

Ок))

Ответить

Развернуть ветку

Артем Кривич

22.06.2020 Автор

Если точнее, сегментация, это вот это что прикреплено на картинке ниже. Наше видео к yolo v3 отношения не имеет. Yolo это просто сетка, которая находит и классифицирует объекты на 2-мерной картинке. То что представлено в нашем видео, создает из 2D картинки - 3D, и не просто выделяет машины, но и понимает, как далеко они находятся от камеры и находит их границы.

Ответить

Развернуть ветку

Аккаунт удален

23.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Артем Кривич

23.06.2020 Автор

Ок, разобрались что-то такое сегментация, это уже отлично, и что это не 2Д классификация йолой)
Нет, естественно камеры ограничены природными условиями, также как любой датчик.
Мы определяем размеры и расстояния, с трекшеном также будут скорости объектов.

Ответить

Развернуть ветку

Аккаунт удален

23.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Артем Кривич

23.06.2020 Автор

Ну что ж поделать)

Ответить

Развернуть ветку

Аккаунт удален

23.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Артем Кривич

23.06.2020 Автор

Так может вы сами попробуете? Сейчас так много вакансий в области self-driving.

Ответить

Развернуть ветку

Аккаунт удален

24.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Артем Кривич

24.06.2020 Автор

В таком случае мой комментарий с описанием, что такое сегментация будет вам полезен. Удачи!

Ответить

Развернуть ветку

Аккаунт удален

24.06.2020

Комментарий недоступен

Ответить

Развернуть ветку

Написать комментарий...

34 комментария

Раскрывать всегда