Нейросети научили думать, а не угадывать - и это сэкономило 99% энергии
Робот с логикой против робота с памятью. 36 часов обучения против 34 минут. 100% энергии против 1%. Tufts University показали, что самый тупой подход к ИИ - учить его на миллионах примеров, если можно просто объяснить правила.
Сейчас роботы работают преимущественно на так называемых VLA-моделях (Vision-Language-Action). Они принимают изображение с камеры, обрабатывают его нейросетью, и на выходе получается команда: куда двинуть руку, что схватить, как повернуться.
Проблема в том, что эти модели обучаются на огромных наборах данных методом проб и ошибок. Им нужны миллионы примеров, гигантские вычислительные мощности и, соответственно, много электричества. При этом стоит встретить ситуацию, которой в обучении не было - и модель теряется. Она не умеет рассуждать, она умеет только узнавать.
Как работает гибридная система
Команда профессора Matthias Scheutz добавила к нейросети второй компонент - модуль символьного рассуждения. И вот как это делит задачи.
Нейросеть смотрит на камеру и отвечает на вопрос "что здесь происходит?": распознаёт объекты, их положение, форму, расстояние. Это она делает хорошо - для этого и обучалась.
Очень солидная часть моей работы - связана с контентом.
И вот 🔥это🔥 решение - экономит мне до 150$ в месяц. А по промокоду NEIROSKUF еще заберите горячую скидку в 15% на любой тариф
Символьный модуль получает эту информацию и дальше работает с логикой: строит план действий по правилам, разбивает задачу на шаги, проверяет условия. Он не угадывает, а, собственно, вычисляет. Примерно как шахматный движок - никакой интуиции, только перебор по правилам.
Вместе они закрывают слабости друг друга. Нейросеть плохо справляется с логикой и обобщением. Символьный модуль не умеет работать с грязными входными данными вроде картинки с камеры. Объединение даёт то, чего нет у каждого по отдельности.
Что показали тесты
Тестировали на задаче "Башня Ханоя": несколько дисков разного размера, три штыря, нужно перенести всю стопку с одного штыря на другой, не кладя больший диск на меньший. Задача классическая, требует планирования на несколько шагов вперёд.
Результаты по обычной версии задачи: VLA-модель - 34% успешных попыток, нейро-символьная система - 95%.
Потом условие усложнили и дали задачу, которой в обучающих данных вообще не было - другая конфигурация дисков, другие правила перестановки. VLA-модель: 0 успешных попыток. Гибридная система: 78%.
Обучение стандартной модели заняло более 36 часов и потребовало полного объёма энергии. Нейро-символьная система обучилась за 34 минуты и потратила 1% от этой энергии. В рабочем режиме потребление также сократилось - до 5% от стандартного.
И почему это не прорыв?
Символьный ИИ существует с 1970-х. Тогда его пробовали использовать как основу для всего - и он ломался, когда правила начинали противоречить друг другу или реальность оказывалась сложнее модели. В итоге к 1990-м от него практически отказались в пользу статистических методов.
Сейчас ситуация другая. Нейросети стали достаточно мощными, чтобы закрывать то, с чем символика не справлялась, - восприятие мира. Поэтому комбинация сработала там, где раньше оба подхода по отдельности давали сбои.
Да, следует понимать, что "Башня Ханоя" - задача с чёткими правилами и предсказуемой средой. Реальный производственный цех - другое. Вибрации, скользкие поверхности, объекты не там, где ожидается. Как символьный модуль ведёт себя с такими входными данными - отдельный вопрос, исследователи пока его не публиковали.
Тем не менее, работа принята на ICRA 2026 в Вене - это ведущая мировая конференция по робототехнике с полноценной научной рецензией.
Если подход подтвердит себя на более сложных сценариях - автономная робототехника получит возможность работать на значительно более слабом железе, без постоянного подключения к мощным серверам. Промышленные манипуляторы, автономные дроны, полевые роботы - всё это сейчас привязано к инфраструктуре. Снижение энергопотребления в 100 раз, как мне кажется, меняет эту привязку в очень выгодном ключе.
Пока - один лабораторный эксперимент. Но направление очень даже перспективное.