Это Sol — искусственный интеллект для self-driving
Нашей идеей в Ralient с самого начала было создание технологии self-driving в основу которого будет положен ИИ на базе существующих и будущих нейросетей (капсульных например, ресеч которых мы также ведем). Мы не хотим делать машину робота, это уже делают десятки компаний.
Я хочу познакомить вас с Sol. Пока что она занимается всем комплексом распознавания объектов на дороге, детекцией сигналов светофоров, может строить простые маршруты, контролировать управление автомобилем и немного предсказывать поведение участников движения. Все это еще тестируется, а Sol каждый день обучается. Мы готовы показать видео с результатами работы модуля восприятия Sol.
Сейчас я могу сказать, что в области восприятия (perception) мы достигли крутых результатов. Мы умеем делать то, что, наверно, не умеет еще никто в мире с той точностью измерений что у нас, не то что по одной камере, а хотя бы по двум. Конечно я сейчас говорю о детекции объектов и определении расстояния до них и их размеров с помощью всего одной камеры.
При этом и в других областях восприятия наши результаты тоже сильны. Но тут это скорее происходит потому, что лидеры рынка находятся в Калифорнии, где погодные условия и качество дорожной сети позволяет забить на многие моменты. Исключением является Tesla. И в данный момент я говорю о детекции полос движения.
Задачам по детекции знаков, светофоров и их сигналов мы уделяем меньше внимания, это не сложные задачи. Сейчас занимаемся оптимизацией, чтобы они ели максимально мало ресурсов.
Скоро мы будем готовы показать и другие модули Sol.
Забавно, что у Sol есть побочные решения, которые могут быть внедрены практически по щелчку пальцев. Например, она может с легкостью распознавать номера всех автомобилей, что встречает на дороге, мгновенно проверять и при необходимости передавать локацию. Может фиксировать нарушения в автоматическом режиме, в том числе со стороны пешеходов. В целом от Sol до квадрокоптеров фиксирующих нарушения на улицах из фильма Upgrade не сильно далеко. Но нужно ли это нам?
Могу ли я сейчас назвать Sol искусственным интеллектом? В зависимости от чего отталкиваться в определении ИИ. Если нейросети это искусственный интеллект — то да. Если нет — то нет. Но мы точно планируем в будущем сделать ее ИИ независимо от определений. И возможно с более широкими задачами, чем self-driving.
" ресеч которых мы также ведем"
*блюёт
Фиксировать нарушения со стороны пешеходов - мечта любого автолюбителя. Или хотя бы водителей городского транспорта. Или велосипедистов. Или вон тех ребят на электросамокатах. Считаю не справедливым, что много тратится на контроль движения авто, и ничего не делается для контроля остальных участников движения.
Самый грустный диалог на свете:
- Кто Вы?
- Я автолюбитель.
- О чем Вы мечтаете?
- Мечтаю фиксировать нарушения со стороны пешеходов.
В защиту пешеходов скажу, что он вас не убьет врезавшись в ваше авто) С другой стороны соглашусь с вами, что электросамокаты на тротуарах представляют реальную опасность.
Не представляют если их водят нормально, а в большинстве случаев их водят хорошо, аналогично как и обычные самокаты/велосипеды. Тех, кто ездит агрессивно полиция может ловить и наказывать, а не запрещать вместо этого езду по тротуарам. Но у нас полиция даже за курение не штрафует, чего уж там до агрессивных людей. А вот езда по дороге, что на самокате, что на велосипеде представляет настоящую опасность. Давайте не будем делать дибильно как в какой-нибудь Австралии, когда на велике и самокате нельзя кататься ни по дорогам, ни по тротуарам.
А можно подробнее про определение дистанции и размеров одной камерой? Я знаю что Тесла умеет это делать с сантиметровой точностью. А какая точность у вас? Сравниваете ли вы разные по времени кадры или можете использовать только один кадр что бы определять дистанции? Как результат, дистанция до любого пикселя или только до распознанного объекта?
Как я знаю Тесла не делает это камерой, а делает это радаром. Нейросети Теслы обучены распознавать стороны машин, это несколько другой подход. Сантиметровой точности (меньше сантиметра) радар вам не даст (по крайней мере из тех, что стоят в автомобилях).
Мы определяем синглшот - то есть с одной картинки. Композиция нескольких камер уточняет. Последовательностью мы в данный момент занимаемся, что также еще увеличит точность. Дистанция до объекта - то есть до машины/пешехода.
Мы публиковали статью несколько ранее, где более подробно рассказывали именно про это:
https://vc.ru/transport/134439-nuzhny-li-lidary-dlya-self-driving-i-zachem-my-opredelyaem-rasstoyaniya-do-obektov-odnoy-kameroy
Нет, у Теслы уже есть дистанция до каждого пикселя и эта информация вычисляется с камеры с помощью ИИ. Посмотрите последнее выступление Карпатного на конференции.
Да, посмотрели, они меряют глубину, а не расстояния, в этом есть существенная разница. При этом точность +/- метр, то есть погрешность достигает почти 2 метров. По крайней мере если судить по этому видео: https://www.youtube.com/watch?v=_1MHGUC_BzQ&t=21s
Но вообще это не так важно, потому что расстояние до объекта и глубина объекта это два разных параметра.
Вы не то видео смотрели. Этому видео уже 2 года. Я имел в виду с выступлением Андрея Карпатного в апреле этого года.
https://youtu.be/hx7BXih7zx8
Про глубину пикселей начиная с 20 минуты.
Погрешность уже не метры а сантиметры.
Мы посмотрели выступление да, отсюда и понимание что они измеряют глубину. А видео привели в качестве примера их результатов. Возможно там измерения ещё идут радаром, уточним этот вопрос. Но сути не меняет, глубина это другой параметр, скорее это их промежуточный этап, ибо глубина никак им не поможет.
А какая разница между глубиной пикселя и дистанцией до объекта? Зная глубину пикселей можно посчитать и дистанцию и размеры объекта.
Да можно, если у вас идеальная глубина, сделанная хорошим лидаром или если вы снимаете картинки пленоптической камерой.
В любом другом случае вы получите неправильные результаты.
Не думаю что требуется идеальная глубина. Даже дорогие лидары не дают идеальной глубины в силу множества причин, от вибраций до разных поверхностей.
Для больших объектов как машина или пешеход, можно отфильтровать не идеальные по глубине пиксели.
Почитал. Там нет никаких подробностей. Можете объяснить ваш подход. Честно говоря я не вижу как можно определить размер/дистанцию с одного кадра не привязываясь к чему то известного размера (разметка на дороге, номер на машине и т.п.)
К сожалению нет, реализация находится под NDA. Все что могу добавить, что это тоже делает ИИ.
Просто нейросеть нормально умеет в подобие фигур. 100% идёт привязка к известным размерам
А что думаете про проект Geohot'а?
https://comma.ai
Классные ребята, но это ADAS, по крайней мере сейчас.
"Сейчас занимаемся оптимизацией, чтобы они ели максимально мало ресурсов."
Приветствую, если интересно - можем с этим помочь. Основное направление нашей компании оптимизация и ускорения чужих нейросетей под конкретное железо заказчика:)
Связаться можно в телеграмме - @rock54
"Мы не хотим делать машину робота, это уже делают десятки компаний."
А что вы хотите сделать?
Больший уклон на ИИ.
Чуть выше на вопрос по поводу Comma.ai вы написали, что у них ADAS. Стало быть, ваше решение претендует на что-то повыше: уровни автономности 4 и 5. В связи с этим вопрос: каким образом вы сможете формально верефицировать ваше решение? Или, говоря проще, как вы собираетесь доказать, что в один прекрасный момент нейронная сеть не выдаст ерунду, которая вызовет аварийную ситуацию?
Претендуем да, на 4 и затем 5. Стандартные процедуры верификации, установленные для любого селф-драйвинга. Законодательство сейчас не предлагает никаких отдельных схем для этого. Будет предлагать - будем отталкиваться от этого.