В общем случае для обучения используется значительная выборка структурированных данных о дорожном полотне, освещённости, климатических условиях, статических и динамических объектах, их взаимном положении и так далее. Чем более качественными и разнообразными будут данные, тем лучше ИИ справится с непредвиденными ситуациями.
Под качеством здесь, в том числе, подразумевается аутентичность данных по отношению к реальным условиям, в которых их планируют применять.
Кстати о «долго и дорого»: в нашем проекте подготовкой и согласованием обучающих видео с конкретными дорожными ситуациями для ИИ занимаются 90 человек. Отбор данных — это, к сожалению, один из самых трудоёмких и дорогостоящих процессов, с которыми сталкиваются специалисты в области искусственного интеллекта. Именно на этом этапе велико искушение делегировать процесс отбора, заменив «реальные» данные симуляцией, сэкономив десятки тысяч человеко-часов.
Может ли компьютер сейчас взять на себя роль генератора обучающей выборки для искусственного интеллекта? Не думаю. Я говорю об «искушении», так как считаю использование синтетических данных при обучении интеллектуальных систем максимальной критичности заблуждением, которое в перспективе может привести к человеческим жертвам.
Имея синтетику можно сгенерировать те ситуации, которые встречаются в реальности - посмотрели на видео с улиц и доработали движок.
Наоборот же нельзя - т.е. если мы понимаем, что наша машина, обученная на реальных данных не умеет корректно обрабатывать ситуацию, когда на нее со встречки кувырком летит машина - мы не сможем накопить реальных записей с подобным кейсом. Так что ключ, имхо, в совмещении двух подходов.
Не совсем понял, почему материал строится по модели "либо синтетика, либо нет". Неужели применение в обучении синтетических данных не сможет сэкономить средства на обучении НС в самом начале, чтобы потом добить точность с 70ти до 99 уже с реальными данными.
По-моему, general point немножко в другом, что типа синтетическая бигдата - хорошо, но Только синтетическая даёт недостаточно точности для коммерческого освоения в конкретных нишевых разработках. С чем, в общем, сложно спорить)
Подумал, что GTA это какая-то техническая аббревиатура, решил срочно зайти и пошутить в комментах про типичную езду в этой игре, но оказалось, что тут тоже про игру ((
Идея интересная, но нереальная. По симуляторам гонок GTA и NFS не сделаешь городской беспилотный автомобиль. А вот полицейский автомобиль - вполне.
Они сделали ИИ из ГТА более аккуратными?