{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

17 авг 2022 17.08.2022

Google создала роботов-официантов для сотрудников — они могут приносить «что-нибудь вкусненькое» и протирать стол Статьи редакции

С помощью нейросетей роботы научились воспринимать трудные языковые запросы, состоящие из нескольких задач.

Google совместно с Everyday Robots (обе компании принадлежат холдингу Alphabet) разработала новых экспериментальных роботов, основанных на языковых ИИ-моделях. Хотя основная цель проекта — изучение методики обучения роботов, в качестве теста они выполняют функции официантов и обслуживают сотрудников офисов Google.
Чтобы система могла лучше распознавать запрос человека, разработчики использовали нейросети, а именно обучающиеся языковые модели. С их помощью робот может выполнить не только конкретную задачу, например, «принеси яблоко», но и более абстрактный запрос: «Я разлил воду, можешь помочь?» или «Я только что тренировался, нужно восстановить силы».
Во время первых тестов языковые модели понимали запрос, но предлагали часто бесполезное решение. К примеру, на жалобу о пролитом напитке GPT-3 предлагала пропылесосить жидкость, а нейросеть FLAN просто извинялась. Результаты стали лучше, когда авторы идеи объединили модель PaLM с уже подготовленным для роботов ПО, распознающем задачу и действие. Новая система PaLM-SayCan сперва распознаёт запрос, а затем трансформирует его в набор наиболее подходящих в контекст задач.

Систему обучили на десятках тысяч примеров выполнения запросов, среди которых отдельно выделили успешно завершённые. Кроме того, роботы анализируют окружающее пространство кухни, находят знакомые предметы и продолжают обучаться на своём опыте. Первые результаты показали, что системе удаётся верно выбрать правильную последовательность действий в 84% случаев, а в 74% — успешно выполнить поставленную задачу.
Авторы проекта настроены позитивно — совмещение языковых моделей с интерфейсом роботов уже помогло сократить количество ошибок понимания запросов в два раза. В будущем такие системы позволят людям куда проще взаимодействовать с роботами — пользователи смогут их программировать, используя свою естественную речь.

Рассказ о проекте от разработчиков

#новость #google

194 показа

5.4K открытий

97 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Andrei Bourdine

17.08.2022

Ответить

Развернуть ветку

Псков Бурито

17.08.2022

Ответить

Развернуть ветку

Andrei Bourdine

17.08.2022

Таксидермисты одобряют

Ответить

Развернуть ветку

Показать 97 комментариев . Вы видите только часть дискуссии

Написать комментарий...

94 комментария

Раскрывать всегда