Живая память для Claude Code

AI-агенты начинают галлюцинировать, придумывая факты вместо того, чтобы вспоминать. Я искал способ превратить claude code и cursor из фантазёра в исследователя — и таким инструментом стал Graphiti

Graphiti создаёт живую, динамическую память для AI-агентов, которая непрерывно обогащается новыми данными. Система:

Непрерывно учится из каждого взаимодействия и сохраняет контекст времени: когда событие произошло и когда граф узнал о нём.
Разрешает противоречия через временную инвалидацию старых связей и умно объединяет дубликаты сущностей.
Масштабируется инкрементально, без пересчета всего графа, что позволяет работать с постоянно растущими потоками данных.
Использует гибридный поиск: семантический (cosine similarity), полнотекстовый (BM25), графовый traversal и cross-encoder reranking для точности и разнообразия результатов.
Позволяет настраивать собственную онтологию сущностей через Pydantic модели.
Универсален по интеграции: поддерживает Neo4j, FalkorDB, Kuzu, Neptune и разные LLM-провайдеры (OpenAI, Anthropic, Gemini).

Каждое взаимодействие — это эпизод, который проходит цепочку:

Извлечение сущностей и отношений.
Инкрементальное добавление в граф знаний с учётом временной валидности (valid_at/invalid_at).
Возможность гибридного поиска как с LLM, так и без него, используя математические и графовые методы.
Би-темпоральная модель: система различает время события (reference_time), время поступления данных (created_at) и период актуальности (valid/invalid).

# В RAG вы ищете документы: "Найти документы похожие на 'проблемы с продуктом'" # В Graphiti вы ищете знания: "Кто жаловался на какие проблемы с каким продуктом в последний месяц?"

RAG: статичные документы, быстрое внедрение на готовых данных, фокус на полнотекстовой семантике.
GraphRAG: анализ больших документарных корпусов, иерархические summary, глобальные инсайты.
Graphiti: динамическая память, временной контекст, факт-ориентированный граф с temporal edges, гибридный поиск без LLM и с LLM.

Постоянно обновляемые данные и взаимодействия с долговременной памятью.
Исследовательские запросы с учётом временного контекста.
Контекстный поиск по накопленному опыту команды и корпоративной памяти.
Делегирование AI-ассистенту поиска достоверной информации из базы.
Сохранение правил работы, разборов ошибок, саммари сессий с агентами.

Гибридный поиск без LLM:

# Поиск комбинирует: - Semantic search (cosine similarity на embeddings) - Full-text search (BM25 на фактах и именах) - Graph traversal (связанные сущности) - Cross-encoder reranking (BERT-like переранжирование) - MMR (Maximum Marginal Relevance) для diversity

RAG подходит для:

Поиск по документам и FAQ
Статичные корпоративные знания
Быстрое внедрение на готовых данных

GraphRAG подходит для:

Анализ больших статичных документарных корпусов
Исследовательские вопросы о статичных данных
Когда нужны глобальные инсайты

Graphiti подходит для:

Взаимодействия с долговременной памятью и принятыми решениями
Исследовательские вопросы о данных
Системы, где данные постоянно обновляются
Поиск по документам и FAQ
Когда важен временной контекст

Graphiti — это попытка создать для AI то, что человеческая эпизодическая память представляет для нашего мышления: динамическую, контекстную, темпорально-осознанную систему знаний.

На практике:

Graphiti не бесплатен и требует API-ключи, а также VPS с 2 CPU и 4 GB 100gb ssd RAM в минималке.

При этом вы получаете полноценный MCP-сервер, который служит прослойкой для подключения агентов — то есть готовую инфраструктуру для ваших AI-асcистентов

Для максимальной эффективности используйте крупную модель gpt5-high-fast, среднюю gpt5-high-fast и эмбеддинги text-embedding-3-large. Такая конфигурация позволяет обрабатывать данные быстро и точно, минимизируя ошибки AI и нарушения структуры.

Что бы сохранить накопленные знания гарантированно, арендовал впс для графити стека

Закрыл порты, добавил авторизацию, сконфигурировал композ стек (все промтами)

В claude code MCP подключил примерно вот так:

{ "mcpServers": { "graphiti": { "command": "npx", "args": [ "mcp-remote@0.1.18", "https://domain.vps.fvds.ru/sse", "--header", "Authorization: Bearer sk_mt_token_value" ] } } }

Мне пришлось форкнуть графити и сделать патч добавляющий нового LLM провайдера, что бы значительно экономить на токенах

В процессе разработки просто прошу клода что-то зафиксировать в графити памяти или кидаю ему целые документы или самари.

Но есть лимиты на размер, войну и мир одним промтом не загрузить

Например в течении двух месяцев я писал доки, делал агентов для клода, выстраивал воркфлоу и часто в прошлом добавлял ту инфу в графити, ту что уже не актуальна сейчас. Несмотря на устаревшие записи, Graphiti корректно отвечал на вопросы о процессах разработки — что показало надёжность и силу эпизодической памяти

Графити хорошо отработал в ответе на вопрос о том как должны работать программисты у нас в проекте. скрин

После использования add_memory данные обрабатываются несколько минут в фоне, после чего их можно искать и использовать в запросах. Это позволяет делегировать поиск AI и не держать все знания в голове или переполнять контекст

На скринах виден юзкейс когда можно делегировать поиск инфы, что бы не писать путь до файла с доками или самому надиктовывать то что уже давно у вас в голове является стандартом

Еще можно попросить клода опросить графити по S.M.A.R.T. технологии.

Пример на скрине:

несколько разных, самостоятельных агентских запроса к графити по MCP

Практические сценарии:

Делегирование поиска информации AI ассистенту с гарантией достоверности, ведь ты сам просил добавить что-то в базу чуть рпньше
Построение корпоративной памяти для проектных команд
Контекстный поиск по накопленному опыту разработки
Гружу в нее транскрипции саммари созвонов людьми
В одной базе можно держать несколько проектов, но не рекомендую, лучше через некий роутер держать стек из нескольких разных доменов
Сохраняю правила работы, запреты, разборы ошибок агента
Сохраняю саммари важных сессий с ии агентами что бы делать исследования максимально не/эффективных промтов или лучших практик в проекте

t.me

Аи Помогатор

Живая память для Claude Code

Как работает Graphiti

Отличия от GraphRAG и подобных систем

Отличие от GraphRAG и RAG

Когда использовать Graphiti

Когда использовать что?