Живая память для Claude Code

AI-агенты начинают галлюцинировать, придумывая факты вместо того, чтобы вспоминать. Я искал способ превратить claude code и cursor из фантазёра в исследователя — и таким инструментом стал Graphiti

Graphiti создаёт живую, динамическую память для AI-агентов, которая непрерывно обогащается новыми данными. Система:

  • Непрерывно учится из каждого взаимодействия и сохраняет контекст времени: когда событие произошло и когда граф узнал о нём.
  • Разрешает противоречия через временную инвалидацию старых связей и умно объединяет дубликаты сущностей.
  • Масштабируется инкрементально, без пересчета всего графа, что позволяет работать с постоянно растущими потоками данных.
  • Использует гибридный поиск: семантический (cosine similarity), полнотекстовый (BM25), графовый traversal и cross-encoder reranking для точности и разнообразия результатов.
  • Позволяет настраивать собственную онтологию сущностей через Pydantic модели.
  • Универсален по интеграции: поддерживает Neo4j, FalkorDB, Kuzu, Neptune и разные LLM-провайдеры (OpenAI, Anthropic, Gemini).

Как работает Graphiti

Каждое взаимодействие — это эпизод, который проходит цепочку:

  1. Извлечение сущностей и отношений.
  2. Инкрементальное добавление в граф знаний с учётом временной валидности (valid_at/invalid_at).
  3. Возможность гибридного поиска как с LLM, так и без него, используя математические и графовые методы.
  4. Би-темпоральная модель: система различает время события (reference_time), время поступления данных (created_at) и период актуальности (valid/invalid).

Отличия от GraphRAG и подобных систем

# В RAG вы ищете документы: "Найти документы похожие на 'проблемы с продуктом'" # В Graphiti вы ищете знания: "Кто жаловался на какие проблемы с каким продуктом в последний месяц?"

Отличие от GraphRAG и RAG

  • RAG: статичные документы, быстрое внедрение на готовых данных, фокус на полнотекстовой семантике.
  • GraphRAG: анализ больших документарных корпусов, иерархические summary, глобальные инсайты.
  • Graphiti: динамическая память, временной контекст, факт-ориентированный граф с temporal edges, гибридный поиск без LLM и с LLM.
Живая память для Claude Code

Когда использовать Graphiti

  • Постоянно обновляемые данные и взаимодействия с долговременной памятью.
  • Исследовательские запросы с учётом временного контекста.
  • Контекстный поиск по накопленному опыту команды и корпоративной памяти.
  • Делегирование AI-ассистенту поиска достоверной информации из базы.
  • Сохранение правил работы, разборов ошибок, саммари сессий с агентами.

Гибридный поиск без LLM:

# Поиск комбинирует: - Semantic search (cosine similarity на embeddings) - Full-text search (BM25 на фактах и именах) - Graph traversal (связанные сущности) - Cross-encoder reranking (BERT-like переранжирование) - MMR (Maximum Marginal Relevance) для diversity

Когда использовать что?

RAG подходит для:

  • Поиск по документам и FAQ
  • Статичные корпоративные знания
  • Быстрое внедрение на готовых данных

GraphRAG подходит для:

  • Анализ больших статичных документарных корпусов
  • Исследовательские вопросы о статичных данных
  • Когда нужны глобальные инсайты

Graphiti подходит для:

  • Взаимодействия с долговременной памятью и принятыми решениями
  • Исследовательские вопросы о данных
  • Системы, где данные постоянно обновляются
  • Поиск по документам и FAQ
  • Когда важен временной контекст

Graphiti — это попытка создать для AI то, что человеческая эпизодическая память представляет для нашего мышления: динамическую, контекстную, темпорально-осознанную систему знаний.

На практике:

Graphiti не бесплатен и требует API-ключи, а также VPS с 2 CPU и 4 GB 100gb ssd RAM в минималке.

При этом вы получаете полноценный MCP-сервер, который служит прослойкой для подключения агентов — то есть готовую инфраструктуру для ваших AI-асcистентов

Для максимальной эффективности используйте крупную модель gpt5-high-fast, среднюю gpt5-high-fast и эмбеддинги text-embedding-3-large. Такая конфигурация позволяет обрабатывать данные быстро и точно, минимизируя ошибки AI и нарушения структуры.

Что бы сохранить накопленные знания гарантированно, арендовал впс для графити стека

Закрыл порты, добавил авторизацию, сконфигурировал композ стек (все промтами)

В claude code MCP подключил примерно вот так:

{ "mcpServers": { "graphiti": { "command": "npx", "args": [ "mcp-remote@0.1.18", "https://domain.vps.fvds.ru/sse", "--header", "Authorization: Bearer sk_mt_token_value" ] } } }

Мне пришлось форкнуть графити и сделать патч добавляющий нового LLM провайдера, что бы значительно экономить на токенах

В процессе разработки просто прошу клода что-то зафиксировать в графити памяти или кидаю ему целые документы или самари.

Но есть лимиты на размер, войну и мир одним промтом не загрузить

Например в течении двух месяцев я писал доки, делал агентов для клода, выстраивал воркфлоу и часто в прошлом добавлял ту инфу в графити, ту что уже не актуальна сейчас. Несмотря на устаревшие записи, Graphiti корректно отвечал на вопросы о процессах разработки — что показало надёжность и силу эпизодической памяти

Графити хорошо отработал в ответе на вопрос о том как должны работать программисты у нас в проекте. скрин

Живая память для Claude Code

После использования add_memory данные обрабатываются несколько минут в фоне, после чего их можно искать и использовать в запросах. Это позволяет делегировать поиск AI и не держать все знания в голове или переполнять контекст

На скринах виден юзкейс когда можно делегировать поиск инфы, что бы не писать путь до файла с доками или самому надиктовывать то что уже давно у вас в голове является стандартом

Живая память для Claude Code

Еще можно попросить клода опросить графити по S.M.A.R.T. технологии.

Пример на скрине:

результат
результат
несколько разных, самостоятельных агентских  запроса к графити по MCP
несколько разных, самостоятельных агентских  запроса к графити по MCP

Практические сценарии:

  • Делегирование поиска информации AI ассистенту с гарантией достоверности, ведь ты сам просил добавить что-то в базу чуть рпньше
  • Построение корпоративной памяти для проектных команд
  • Контекстный поиск по накопленному опыту разработки
  • Гружу в нее транскрипции саммари созвонов людьми
  • В одной базе можно держать несколько проектов, но не рекомендую, лучше через некий роутер держать стек из нескольких разных доменов
  • Сохраняю правила работы, запреты, разборы ошибок агента
  • Сохраняю саммари важных сессий с ии агентами что бы делать исследования максимально не/эффективных промтов или лучших практик в проекте
Живая память для Claude Code
Начать дискуссию