{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Google создала роботов-официантов для сотрудников — они могут приносить «что-нибудь вкусненькое» и протирать стол Статьи редакции

С помощью нейросетей роботы научились воспринимать трудные языковые запросы, состоящие из нескольких задач.

  • Google совместно с Everyday Robots (обе компании принадлежат холдингу Alphabet) разработала новых экспериментальных роботов, основанных на языковых ИИ-моделях. Хотя основная цель проекта — изучение методики обучения роботов, в качестве теста они выполняют функции официантов и обслуживают сотрудников офисов Google.
  • Чтобы система могла лучше распознавать запрос человека, разработчики использовали нейросети, а именно обучающиеся языковые модели. С их помощью робот может выполнить не только конкретную задачу, например, «принеси яблоко», но и более абстрактный запрос: «Я разлил воду, можешь помочь?» или «Я только что тренировался, нужно восстановить силы».
  • Во время первых тестов языковые модели понимали запрос, но предлагали часто бесполезное решение. К примеру, на жалобу о пролитом напитке GPT-3 предлагала пропылесосить жидкость, а нейросеть FLAN просто извинялась. Результаты стали лучше, когда авторы идеи объединили модель PaLM с уже подготовленным для роботов ПО, распознающем задачу и действие. Новая система PaLM-SayCan сперва распознаёт запрос, а затем трансформирует его в набор наиболее подходящих в контекст задач.
  • Систему обучили на десятках тысяч примеров выполнения запросов, среди которых отдельно выделили успешно завершённые. Кроме того, роботы анализируют окружающее пространство кухни, находят знакомые предметы и продолжают обучаться на своём опыте. Первые результаты показали, что системе удаётся верно выбрать правильную последовательность действий в 84% случаев, а в 74% — успешно выполнить поставленную задачу.
  • Авторы проекта настроены позитивно — совмещение языковых моделей с интерфейсом роботов уже помогло сократить количество ошибок понимания запросов в два раза. В будущем такие системы позволят людям куда проще взаимодействовать с роботами — пользователи смогут их программировать, используя свою естественную речь.
Рассказ о проекте от разработчиков
0
97 комментариев
Написать комментарий...
Andrei Bourdine
Ответить
Развернуть ветку
Псков Бурито
Ответить
Развернуть ветку
Andrei Bourdine

Таксидермисты одобряют

Ответить
Развернуть ветку
94 комментария
Раскрывать всегда