Почему статистика уперлась в потолок, и как физика решит проблему AGI
GPT-4 пишет код и сдает экзамены, но под капотом это перемножение матриц и предсказание следующего слова. Мозг работает иначе: у него нет батчей, глобальной loss-функции и гигабайтов обучающей выборки. В этой статье я рассказываю про альтернативный путь к AGI термодинамические графы, где мысль возникает не как результат вычисления, а как фазовый переход, а и еще сразу оговорюсь это 1 статья поэтому пока что архитектуру прикладывать не стану
Термодинамические графы: мышление как физический процесс, а не как статистика TL;DRСовременный ИИ построен на статистическом обучении: миллиарды примеров, градиентный спуск, предсказание следующего токена. Это работает, но не отвечает на вопрос — почему структура вообще способна думать. В статье разбираю альтернативный подход: термодинамические графы, где мышление возникает из физики самой структуры. Без backprop, без датасетов, без дата-центров. Делюсь принципом, текущими результатами и честными ограничениями.
С чего всё началось Когда смотришь на современный ИИ, возникает странное чувство. GPT-4 пишет код лучше джунов, отвечает на вопросы по квантовой физике, генерирует изображения. Но если копнуть глубже — там перемножение матриц с заученными весами. Это работает, но не похоже на то, как работает мозг.
Мозг не делает forward pass. Не ждёт батча. У него нет глобальной loss function. Мозг — это непрерывная физическая система, где каждый нейрон живёт своей жизнью, а мышление возникает как побочный продукт коллективной динамики.
Возник вопрос: можно ли построить вычислительную систему, которая работает по таким же принципам? Не симулирует мозг, а наследует его физику.
Так появились термодинамические графы.
Что такое термодинамический граф Обычный граф — статичная структура из узлов и связей. Алгоритмы ходят по нему как путешественник по карте.
Термодинамический граф — физическая система. У каждого узла есть состояние:
Активация — текущая энергия Напряжение (tension) — накопленное противоречие Важность (importance) — историческая значимость Контекстное эхо — затухающий след недавних активаций У системы в целом:
Температура — глобальный уровень хаоса Волновая функция Ψ — распределение энергии по всем узлам Синапсы между узлами имеют не только вес, но и миелин — параметр защиты от перезаписи. Стабильные часто используемые связи “обрастают миелином” и становятся резистентными к ослаблению. Это прямой аналог биологической миелинизации.
И главное — всё это физически взаимодействует. Импульс распространяется волной, отражается, интерферирует с другими волнами, создаёт резонансы и аттракторы.
Откуда берутся мысли В классическом ML мысль — это вектор в латентном пространстве или распределение вероятностей. В обоих случаях — результат вычисления.
В термодинамическом графе мысль — это фазовый переход.
Механизм:
Внешний импульс или внутреннее напряжение создаёт волну активации Волна распространяется через синапсы по пути наименьшего сопротивления По мере распространения система остывает (температура падает) При достаточно низкой температуре волна кристаллизуется в устойчивый аттрактор — набор одновременно активных узлов Этот аттрактор и есть мысль Аналогия с физикой прямая: фазовый переход жидкость → кристалл. Высокая температура — хаотичное движение по всему графу. Низкая температура — стабильная конфигурация замерзает в оформленную мысль.
Никто не учит систему, какие мысли правильные. Они возникают из физики.
Как это превращается в язык В обычном NLP грамматика учится из миллиардов примеров: модель видит “кошка ест рыбу” миллион раз и запоминает структуру субъект-глагол-объект.
В термодинамическом графе синтаксис не программируется и не учится в привычном смысле. Он возникает через эволюционное давление внешней среды.
Среда здесь — внешний оценщик (в текущей реализации это LLM в роли судьи логики, но принцип не требует именно LLM). Среда оценивает сырые волновые вспышки графа и даёт обратную связь.
Процесс выглядит так:
Фаза 1. Граф связывает базовые понятия и выдаёт сырую мысль: воля деспотия человек
Фаза 2. Среда видит, что логика верна, но речь телеграфная. Возвращает отрицательный сигнал (pain ≈ 0.3) и впрыскивает в граф недостающие служебные слова: против, деспотии, в, человеке
Фаза 3. Из-за отрицательного подкрепления прямая связь “воля → деспотия” слабеет (anti-Hebbian). На следующем цикле волна ищет обходной маршрут и проходит через свежие узлы предлогов: воля → против → деспотии
Фаза 4. Среда читает “воля против деспотии”. Логика и грамматика совпали. Положительное подкрепление (+0.1), маршрут закрепляется миелинизацией.
Дополнительный механизм — по мере созревания граф начинает извлекать операторы из собственной структуры. Линеаризатор находит узлы с самыми отрицательными весами (chief_inhibitor) и физически использует их для выражения отрицания.
Предлоги и союзы здесь — не правила из учебника. Это узлы-хабы, через которые маршрутизируется энергия. Язык вырастает из физики под давлением среды.
На графах в 300 узлов уже наблюдается стабильное появление синтаксических связок.
Обучение через 5 контуров обратной связи Обучение есть, но оно распределённое и непрерывное:
- Правило Хебба. Узлы, активирующиеся одновременно, усиливают связь между собой. Локальное правило, без глобального backprop.
- Anti-Hebbian melt. При негативной обратной связи от среды связи между активными в момент ошибки узлами ослабляются пропорционально интенсивности pain-сигнала.
- Защита от стагнации. Если граф выдаёт одну и ту же мысль несколько циклов подряд, награда обнуляется, а напряжение в задействованных узлах искусственно растёт. Системе становится “больно” от стагнации, что выталкивает волну в неисследованные области графа.
- Когнитивный импеданс. Локально вычисляется отношение Z = Tension / Flow. Когда напряжение в узле существенно превышает его пропускную способность, происходит сброс такта и запрос новой информации от среды. Это аналог “признания собственного непонимания”.
- Сон. Периодически система входит в режим консолидации: важные паттерны проигрываются повторно для закрепления, слабые шумовые синапсы удаляются (прунинг), стабильные пути дополнительно миелинизируются.
Зачем это нужно Справедливый вопрос — у нас уже есть мощные LLM.
Энергоэффективность. LLM требуют дата-центры. Мозг работает на 20 ваттах. Термодинамический граф работает на разреженных матрицах (scipy.sparse) и активирует только релевантные узлы — потенциально на порядки эффективнее по ваттам на единицу полезного вывода.
Непрерывное обучение. LLM после обучения статичны. Любое новое знание требует дообучения. Термодинамический граф учится каждый цикл, без катастрофического забывания — миелин защищает старый опыт от перезаписи новым.
Эмерджентность от первых принципов. В трансформерах эмерджентные способности — это эмпирический сюрприз. В термодинамическом графе эмерджентность — прямое следствие физики, и её можно предсказывать аналитически.
Прозрачность. Можно открыть граф и посмотреть, что система “думает”: какие узлы активны, где накопилось напряжение, куда течёт волна. В нейросети с миллиардами параметров аналогичной прозрачности нет.
Связь слов с реальностью (grounding) Одно из ключевых ограничений символьных систем — отрыв символа от его значения. Граф может великолепно генерировать синтаксис, но что значит “вычислить” если система никогда ничего не вычисляла?
(еще в разработке) Текущее решение — интеграция с песочницей через генератор инструментов. Когда волна формирует мысль типа написать функция для парсинг, отдельный модуль генерирует Python-код, запускает его в изолированной среде и при успешном выполнении вшивает в граф теги результата (вычислил, результат). Узлы концептов получают связь с реальным успешным действием.
Это пока ограниченное решение — работает только для задач которые можно выразить в коде. Полноценный grounding требует больше каналов взаимодействия со средой. (еще в разработке)
Ограничения и честная картина Это не “вот, готовый AGI”. У подхода серьёзные открытые вопросы:
Масштабируемость. Текущие эксперименты на масштабах 200-500 узлов. Будет ли это работать на миллионе узлов без вычислительных и численных проблем — открытый вопрос. Возможны фазовые переходы которые сейчас непредсказуемы.
Время эволюции. Чтобы граф через эволюционное давление “вырастил” сложное поведение, нужны тысячи циклов взаимодействия со средой. Это часы или дни автономных сессий на простых задачах.
Метрики. Стандартные бенчмарки для LLM (MMLU, HumanEval) плохо подходят для оценки такой системы. Нужны новые методы измерения качества, которые ещё предстоит разработать.
Зависимость от среды-оценщика. Текущая реализация использует LLM как внешнего судью, что технически означает зависимость от LLM. В долгосрочной перспективе среда должна быть заменена на реальное взаимодействие с миром через инструменты и сенсоры.
Что дальше Направления текущей работы:
Эволюционный слой — популяция графов, отбор по fitness, передача “генома” (миелинизированных связей) между поколениями Расширение grounding — больше типов инструментов через которые граф взаимодействует с внешним миром Масштабирование — переход от тысяч к сотням тысяч узлов с замером изменения свойств системы Перенос ядра на Rust — текущий Python-прототип хорош для итераций, но упирается в производительность Заключение Термодинамические графы — не альтернатива нейросетям. Это другой способ задать вопрос: что такое мышление как физический процесс.
Возможно из этого вырастет полноценный AGI. Возможно нет. Возможно это станет нишевым подходом для задач где важна интерпретируемость и непрерывное обучение. Возможно идея упрётся в стену через год и я скажу “не получилось”.
Но попробовать стоит. Современный ИИ упёрся в потолок данных и вычислений. А природа решила задачу интеллекта совсем иначе — через физику и эволюцию. И этот путь пока почти не исследован.
Если интересно — пишите в комментариях. Особенно ценны конкретные возражения и указания на слабые места.Честный FAQ (или ответы на неизбежные вопросы)Я понимаю, что заявка на «физику мышления» звучит амбициозно, поэтому давайте сразу снимем розовые очки и разберем главные уязвимости текущего прототипа.
- Вы говорите про энергоэффективность в 20 ватт и физику, но запускаете это на Python. Разве вы не тратите кучу энергии на математическую симуляцию физики? Абсолютно верно. Текущая реализация на классическом «фон-неймановском» железе (CPU/GPU) — это математическая модель физико-подобных процессов. Разреженные матрицы (scipy.sparse) дают алгоритмическую оптимизацию, но это не настоящая физика. Настоящий выигрыш в энергии (те самые 20 ватт) появится только при переносе этой архитектуры на нейроморфное железо (аналоговые процессоры, spiking-чипы вроде Intel Loihi). Текущий код — это, по сути, спецификация архитектуры, которая в перспективе идеально ляжет на такое железо.
- У вас один узел отвечает за концепт «деспотия». Разве это не старая проблема «бабушкиного нейрона» из символьного ИИ? Да, в текущем прототипе узлы — это конкретные слова/концепты. Я отдаю себе отчет, что это сильное упрощение. Это стадия первичной загрузки (bootstrapping). Мне нужны были готовые «семантические якоря», чтобы проверить центральную гипотезу: способна ли волна маршрутизировать синтаксис под давлением среды? В зрелой архитектуре (v2.0) концепт уровня «деспотия» не должен быть одним узлом. Это должен быть распределенный аттрактор, состоящий из сотен микро-фичей. Сейчас мы тестируем базовый принцип физики графа, чтобы позже спуститься на уровень абстракции ниже.
- Если вашу систему оценивает LLM, не получается ли так, что граф просто выучивает статистические предпочтения этой конкретной нейросети? (Дистилляция) Это самый серьезный риск, и сейчас система действительно балансирует на грани между эмерджентностью и дистилляцией. Но есть важное отличие: LLM выступает в роли «ограничителя среды», а не суфлера. Она оценивает сырую мысль, выдает сигнал pain/reward (больно/хорошо), но не генерирует правильные веса для графа. Граф сам перестраивает свою физику и ищет обходные пути (через узлы-предлоги), чтобы избежать боли. LLM — это временный костыль. В будущем среда будет заменена на множественные ортогональные источники: исполнение кода, проверка гипотез в песочнице, эволюционный отбор. Когда система начнет получать боль от неработающего Python-кода, а не от промпта, зависимость от LLM исчезнет.
- На 300 узлах волна находит путь. Но на миллионе узлов волна либо затухнет в шуме, либо вызовет «эпилепсию» всего графа. Как это масштабировать? Это главный открытый вопрос. На текущих масштабах проблему взрыва активации решает адаптивная температура (гомеостаз) и anti-Hebbian melt (самопроизвольное ослабление слишком активных путей). Но для миллионов узлов этого не хватит. Целевое решение — переход к топологии Small-world network: плотные локальные кластеры (аналог колонок в коре мозга), соединенные редкими длинными связями (белое вещество). Плюс введение ингибирующих (тормозных) узлов с отрицательными весами — прямой аналог GABA-эргических нейронов, которые будут локально гасить «эпилепсию». На практике масштабирование дальше 500 узлов — это следующий большой этап исследований.