Робот Spot научился читать манометры: Boston Dynamics встроила в него «рассуждающий» AI от Google
Boston Dynamics и Google DeepMind показали, как выглядит следующий шаг для роботов — не «выполнять заученные команды», а понимать, что происходит вокруг, и решать самому. Четвероногого робота Spot оснастили моделью Gemini Robotics-ER 1.6. Разберёмся, что это меняет и почему именно скучная задача «посмотреть на прибор» оказалась здесь ключевой.
Что такое embodied reasoning
Аббревиатура ER в названии модели расшифровывается как embodied reasoning — «воплощённое рассуждение». Идея в том, чтобы дать AI не просто текст или картинку, а физическое присутствие в мире: робот видит обстановку через камеры и сам соображает, что с ней делать. Это давно показывали в исследованиях, но найти применение, где такой робот приносит реальную коммерческую пользу, было трудно.
Gemini Robotics-ER 1.6 работает как высокоуровневый «мозг» робота. Он не дёргает моторы напрямую, а рассуждает и вызывает инструменты — может обратиться к поиску Google за справкой, запустить более низкоуровневые модели управления или выполнить заданные функции. По сути, это слой принятия решений поверх «тела» Spot.
Почему манометр — это важно
Звучит буднично: робот смотрит на прибор и называет показания. Но именно эта задача — флагманский пример новой модели, и придумали её в DeepMind не на пустом месте, а в плотной работе с Boston Dynamics, для реальной задачи инспекции промышленных объектов.
Дело в том, как Spot это делает. Модель использует «агентное зрение»: она не пытается распознать стрелку одним взглядом, а действует пошагово, как человек. Сначала приближает изображение прибора, чтобы лучше разглядеть. Затем считает деления шкалы, определяет интервалы между ними, прикидывает положение стрелки — и выдаёт точное число. Это не «узнавание объекта», а маленькая цепочка рассуждений с промежуточными шагами.
К этому добавились многоракурсное понимание (робот использует несколько камер и достраивает картину, даже когда объекты загораживают друг друга) и «детекция успеха» — Spot сам оценивает, выполнил ли он задачу или надо повторить. Раньше за этим следил человек.
Где здесь реальная ценность, а где витрина
В демо Spot эффектно читает рукописный список дел, раскладывает обувь, носит бельё в корзину и даже выгуливает собаку на поводке. Это красиво, но честнее смотреть на то, на чём компания делает акцент сама: промышленная инспекция. Заводы, трубопроводы, энергообъекты — там сотни приборов, которые надо постоянно обходить и проверять. Робот, который сам обходит объект, читает датчики, замечает разлив или открытую дверь, — вот реальный сценарий, а не прогулка с собакой.
И тут стоит назвать преимущество Boston Dynamics, которое сложно скопировать. Компания — одна из немногих, кто реально развернул шагающих роботов в масштабе: несколько тысяч Spot'ов уже работают на настоящих объектах. Это не лаборатория, а живая эксплуатация — а значит, поток реальных данных о том, как модель ведёт себя в грязных, сложных, непредсказуемых условиях. Чем больше роботов в поле, тем быстрее улучшается AI, и тем труднее догоняющим повторить этот опыт. Преимущество не в самой модели (она от Google), а в масштабе развёртывания под неё.
Чего пока нет
Без отрезвляющей ноты не обойтись, иначе будет пресс-релиз, а не разбор. Сами участники проекта признают: до полной автономности далеко. Надёжность в разных условиях ещё предстоит доказать, и Boston Dynamics прямо говорит о «контролируемом развёртывании» с оглядкой на обратную связь от заказчиков — робот должен почти не ошибаться, иначе ложные тревоги убьют доверие. А исследователи аккуратно напоминают: слова «рассуждение» и «понимание» применительно к роботам звучат громко, но что они означают на практике — пока не всегда очевидно.
Тем не менее направление понятное. Самое интересное не в том, что робот выгуливает собаку, а в том, что машина впервые делает осмысленную цепочку шагов в физическом мире сама — посмотреть, приблизить, посчитать, ответить. Для завода это уже не фокус, а инструмент. А накопленный на тысячах роботов опыт DeepMind планирует переносить и на другие платформы, включая человекоподобного Atlas.