{"id":14284,"url":"\/distributions\/14284\/click?bit=1&hash=82a231c769d1e10ea56c30ae286f090fbb4a445600cfa9e05037db7a74b1dda9","title":"\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0444\u0438\u043d\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0430 \u0442\u0430\u043d\u0446\u044b \u0441 \u0441\u043e\u0431\u0430\u043a\u0430\u043c\u0438","buttonText":"","imageUuid":""}

Логический вывод FractalGPT

FractalGPT — это система, которая уникальна своей многоагентной архитектурой. В рамках этой системы мы разработали нейросемантический движок, ставший основой для создания множества агентов. Особенность этого движка заключается в том, что он изначально не включает в себя языковые модели на базе больших языковых моделей (LLM) или нейронные сети. Однако эти элементы могут быть интегрированы в систему при необходимости.

При разработке этой системы нашим источником вдохновения послужил мозг собаки, так как он довольно хорошо описан в литературе. Мы аккуратно воссоздали логическое мышление, которое присуще затылочно-теменной коре мозга животного. Что включает в себя механизмы суммации, долговременной потенциации и латерального торможения, ключевые аспекты долгосрочной памяти, а также сложные процессы, связанные с моделированием эмоций, в том числе выработку нейромедиаторов.

Моделирование эмоционального фона агента. На графике показан расчет подкрепления и "общего возбуждения" системы рассчитываемые из 3х эмоций, спектр эмоций будет расширяется.

Наша система смогла воспроизвести знаменитый эксперимент Павлова, демонстрируя слюноотделение у виртуальной собаки при услышанном звуке колокольчика. Этот результат был достигнут благодаря использованию методики, основанной на максимизации энергии, выделяемой в процессе установления связей между нейронами. Мы также разработали модели кальциевых насосов в нейронах и нейронов, блокируемых магнием.

Красным показан стимул (звонок колокольчика), синим - результат работы модуля для моделирования эмоционального фона, янтарным - показан реакция на стимул, зеленым - потенциалы действия(без учета периода поляризации/деполяризации нейрона)

Ниже показан график обучения без долговременной потенциации, поэтому обучение идет дольше. Мы видим, что вначале звонок не вызывает потенциалов действия(ПД), так же видно наличие суммации, после обучения методом Павлова(описан выше), появляются ПД.

Эта модель образована соединением модели кальциевых синапсов, системы для моделирования эмоционального фона(о ней писал ранее), и системы стимул-реакция, которая является сильно модифицированной сетью Хебба.

Последние модификации включают разработку матричных логических правил и синтез абстрактных правил, не привязанных к конкретным входным данным. Наша система логического вывода отличается уникальной способностью работать с различными типами данных, включая эмбеддинги нейросетей, сырые данные датчиков, атомарные правила и значения. Она способна обрабатывать эти данные одновременно. Также обладает гибкостью в обучении: система может быть предварительно обучена, обучаться в реальном времени, используя принципы, аналогичные биологическому мозгу. Она способна иметь предварительно загруженные правила или синтезировать их, автоматически создавая и улучшая объединенное представление мира на основе разнообразных и разномодальных данных, таких как изображения, звук, видео, текст и т.д.. Мы будем постепенно показывать перечисленные фичи. Математический агент FractalGPT, уже был показан на ИИ конференции Ai Journey, по-сути это LLM + логический движок + решатель. Ссылка на выступление:

Важной особенностью данной системы является ее способность к расширению и адаптации благодаря внутренней многоагентной системе. Это позволяет системе логического вывода эффективно работать с нестационарными данными и непрерывно адаптироваться к новым условиям. Еще одной отличительной чертой нашей системы является подсистема автоматического формирования предметных онтологий, что позволяет переиспользовать правила логического вывода, на малоизученных объектах, подменяя объект онтологическим классом, в который он входит.

Для трансляции разнородных входных данных в логический движок используются т.н. интерпретаторы, ими могут быть LLM, классификаторы, фаззификаторы и т.п.

Тестируем нашу систему на различном оборудовании, таком как ПК, смартфоны, RPi 2 и 3 model B, Orange Pi Zero, и совсем крошечном RPi Pico.

По результатам тестов мы убедились, что наш нейросемантический движок способен работать практически на любом оборудовании. Сложность автоматически формируемых правил зависит от мощности устройства, правила перестают усложняться при падении производительности системы ниже определенного уровня.

Тесты

Использование системы логического вывода в задаче обучения с подкреплением (сравнение с policy gradient). Задача состоит в том чтобы используя метод обучения с подкреплением обучить простой классификатор. На рисунке ниже показано решение этой задачи с использованием алгоритма Policy gradient, т.е. алгоритма обучения политики (под политикой понимается тот самый классификатор), в отличии от DQN, где обучается не сам классификатор, а модель прогнозирующая вознаграждения в зависимости от пары (state, action).

Полносвязная нейросеть 5 входов, 15 нейронов скрытый слой, 2 выхода алгоритм обучения Policy gradient

Эта задача была также решена при помощи нашей системы логического вывода + классификатор с обучением при помощи Policy gradient. За счет того, что признаками были состояния не из среды, а из ее логической модели. число партий получилось примерно в 7 раз меньше.

Логический вывод + полносвязная нейросеть 5 входов, 15 нейронов скрытый слой, 2 выхода алгоритм обучения Policy gradient.

Второй модельный пример.
Управление скоростью автомобиля, входы в систему: атомарное описание среды, а также значение текущей скорости. На изображении ниже представлены следующие ситуации, разгон до некоторой постоянной скорости, скорость не задана строго, она формируется также внутри логического движка, исходя из типа покрытия, типа трассы длинны пути и т.п.. Вторая ситуация это поддержание постоянной скорости. Третья, по признакам объекта на дороге вычисляется его онтологический класс (в данном случае "животное") и принимается решение об экстренном торможении. Четвертая, это команда пользователя увеличить скорость, после отмены команды скорость стабилизируется.

Тут показан пример пониманий онтологий и отдельных значений, некий классификатор распознает свойства животного (в данном случае эти свойства задаются жестко из среды), а система понимает, что объект на дороге относится к онтологическому классу "животные", а следовательно надо резко сбросить скорость.

Третий пример

В третьем примере система логического вывода работает совместно с GPT-like моделью и модулем устранения галлюцинаций. Система логического вывода применялась для синтеза формул и решения математических задач. В этом примере она и отвечает за работу многоагентной системы (способность агентов договариваться).

Вывод

Следует отметить, что во всех трёх экспериментах использовалось не три разных логических движка, а один. В первом эксперименте он получает на вход векторы и помогает быстрее обучать классификатор, использующий стратегию обучения с подкреплением. Во втором управляет скоростью автомобиля, получая на вход текущую скорость и некоторые свойства объекта, встречающегося на дороге(причем сам понимает, что это за объект) и команд, например, нажатие на педаль газа. Но нажатие на нее не напрямую управляет скоростью, а опосредовано через логический движок, учитывая множество других входных данных. В третьем мы показываем использование той же технологии, но уже для переговоров агентов. Что подтверждает универсальность нашей системы логического вывода для решения разнородных задач.

Области применения

  • Робототехника (Полностью автономные роботы с самообучением, мультимодальным входом и логическим выводом)
  • Диалоговые системы (выработка/адаптация алгоритма ведения диалога и управление LLM, чтобы она следовала синтезированному/загруженному скрипту)
  • Эмпатичные боты, благодаря тому, что логический вывод завязан на моделировании эмоций есть возможность выдавать наружу эти самые эмоции и отражать их в интерфейсе, что сделает общение с ботом более "живым"
  • Экспертные системы
  • Интеллектуальные агенты в структуре многоагентных систем, благодаря тому, что у системы логического вывода есть внутренний язык, который может быть использован для переговоров между агентами(как показано в тесте #3), скорость переговоров существенно возрастает, а стоимость падает, по сравнению с МАС, реализованными на LLM.

Наши продукты

Cайт про мультиагентный ИИ:

Сайт сервиса QA агента, где вы можете создать себе нейросотрудника, который будет отвечать на ваши вопросы.

0
Комментарии
-3 комментариев
Раскрывать всегда