{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Google создала роботов-официантов для сотрудников — они могут приносить «что-нибудь вкусненькое» и протирать стол Статьи редакции

С помощью нейросетей роботы научились воспринимать трудные языковые запросы, состоящие из нескольких задач.

  • Google совместно с Everyday Robots (обе компании принадлежат холдингу Alphabet) разработала новых экспериментальных роботов, основанных на языковых ИИ-моделях. Хотя основная цель проекта — изучение методики обучения роботов, в качестве теста они выполняют функции официантов и обслуживают сотрудников офисов Google.
  • Чтобы система могла лучше распознавать запрос человека, разработчики использовали нейросети, а именно обучающиеся языковые модели. С их помощью робот может выполнить не только конкретную задачу, например, «принеси яблоко», но и более абстрактный запрос: «Я разлил воду, можешь помочь?» или «Я только что тренировался, нужно восстановить силы».
  • Во время первых тестов языковые модели понимали запрос, но предлагали часто бесполезное решение. К примеру, на жалобу о пролитом напитке GPT-3 предлагала пропылесосить жидкость, а нейросеть FLAN просто извинялась. Результаты стали лучше, когда авторы идеи объединили модель PaLM с уже подготовленным для роботов ПО, распознающем задачу и действие. Новая система PaLM-SayCan сперва распознаёт запрос, а затем трансформирует его в набор наиболее подходящих в контекст задач.
  • Систему обучили на десятках тысяч примеров выполнения запросов, среди которых отдельно выделили успешно завершённые. Кроме того, роботы анализируют окружающее пространство кухни, находят знакомые предметы и продолжают обучаться на своём опыте. Первые результаты показали, что системе удаётся верно выбрать правильную последовательность действий в 84% случаев, а в 74% — успешно выполнить поставленную задачу.
  • Авторы проекта настроены позитивно — совмещение языковых моделей с интерфейсом роботов уже помогло сократить количество ошибок понимания запросов в два раза. В будущем такие системы позволят людям куда проще взаимодействовать с роботами — пользователи смогут их программировать, используя свою естественную речь.
Рассказ о проекте от разработчиков
0
97 комментариев
Написать комментарий...
Spoilerok

Бесполезная штука. Открывать пивную банку одной лапой не получится.

Ответить
Развернуть ветку
Злой Полушубок

Все уже давно придумано.

Ответить
Развернуть ветку
лука

Мне такое на рабочий стол надо...

Ответить
Развернуть ветку
94 комментария
Раскрывать всегда