Нейросети научили думать, а не угадывать - и это сэкономило 99% энергии

Робот с логикой против робота с памятью. 36 часов обучения против 34 минут. 100% энергии против 1%. Tufts University показали, что самый тупой подход к ИИ - учить его на миллионах примеров, если можно просто объяснить правила.

Сейчас роботы работают преимущественно на так называемых VLA-моделях (Vision-Language-Action). Они принимают изображение с камеры, обрабатывают его нейросетью, и на выходе получается команда: куда двинуть руку, что схватить, как повернуться.

Проблема в том, что эти модели обучаются на огромных наборах данных методом проб и ошибок. Им нужны миллионы примеров, гигантские вычислительные мощности и, соответственно, много электричества. При этом стоит встретить ситуацию, которой в обучении не было - и модель теряется. Она не умеет рассуждать, она умеет только узнавать.

Команда профессора Matthias Scheutz добавила к нейросети второй компонент - модуль символьного рассуждения. И вот как это делит задачи.

Нейросеть смотрит на камеру и отвечает на вопрос "что здесь происходит?": распознаёт объекты, их положение, форму, расстояние. Это она делает хорошо - для этого и обучалась.

Очень солидная часть моей работы - связана с контентом.
И вот 🔥это🔥 решение - экономит мне до 150$ в месяц. А по промокоду NEIROSKUF еще заберите горячую скидку в 15% на любой тариф

Символьный модуль получает эту информацию и дальше работает с логикой: строит план действий по правилам, разбивает задачу на шаги, проверяет условия. Он не угадывает, а, собственно, вычисляет. Примерно как шахматный движок - никакой интуиции, только перебор по правилам.

Вместе они закрывают слабости друг друга. Нейросеть плохо справляется с логикой и обобщением. Символьный модуль не умеет работать с грязными входными данными вроде картинки с камеры. Объединение даёт то, чего нет у каждого по отдельности.

Тестировали на задаче "Башня Ханоя": несколько дисков разного размера, три штыря, нужно перенести всю стопку с одного штыря на другой, не кладя больший диск на меньший. Задача классическая, требует планирования на несколько шагов вперёд.

Результаты по обычной версии задачи: VLA-модель - 34% успешных попыток, нейро-символьная система - 95%.

Потом условие усложнили и дали задачу, которой в обучающих данных вообще не было - другая конфигурация дисков, другие правила перестановки. VLA-модель: 0 успешных попыток. Гибридная система: 78%.

Обучение стандартной модели заняло более 36 часов и потребовало полного объёма энергии. Нейро-символьная система обучилась за 34 минуты и потратила 1% от этой энергии. В рабочем режиме потребление также сократилось - до 5% от стандартного.

Символьный ИИ существует с 1970-х. Тогда его пробовали использовать как основу для всего - и он ломался, когда правила начинали противоречить друг другу или реальность оказывалась сложнее модели. В итоге к 1990-м от него практически отказались в пользу статистических методов.

Сейчас ситуация другая. Нейросети стали достаточно мощными, чтобы закрывать то, с чем символика не справлялась, - восприятие мира. Поэтому комбинация сработала там, где раньше оба подхода по отдельности давали сбои.

Да, следует понимать, что "Башня Ханоя" - задача с чёткими правилами и предсказуемой средой. Реальный производственный цех - другое. Вибрации, скользкие поверхности, объекты не там, где ожидается. Как символьный модуль ведёт себя с такими входными данными - отдельный вопрос, исследователи пока его не публиковали.

Тем не менее, работа принята на ICRA 2026 в Вене - это ведущая мировая конференция по робототехнике с полноценной научной рецензией.

Если подход подтвердит себя на более сложных сценариях - автономная робототехника получит возможность работать на значительно более слабом железе, без постоянного подключения к мощным серверам. Промышленные манипуляторы, автономные дроны, полевые роботы - всё это сейчас привязано к инфраструктуре. Снижение энергопотребления в 100 раз, как мне кажется, меняет эту привязку в очень выгодном ключе.

Пока - один лабораторный эксперимент. Но направление очень даже перспективное.

t.me

Нейроскуф | Про Нейросети&AI

Нейросети научили думать, а не угадывать - и это сэкономило 99% энергии

Как работает гибридная система

Что показали тесты

И почему это не прорыв?