Живая память для Claude Code
AI-агенты начинают галлюцинировать, придумывая факты вместо того, чтобы вспоминать. Я искал способ превратить claude code и cursor из фантазёра в исследователя — и таким инструментом стал Graphiti
Graphiti создаёт живую, динамическую память для AI-агентов, которая непрерывно обогащается новыми данными. Система:
- Непрерывно учится из каждого взаимодействия и сохраняет контекст времени: когда событие произошло и когда граф узнал о нём.
- Разрешает противоречия через временную инвалидацию старых связей и умно объединяет дубликаты сущностей.
- Масштабируется инкрементально, без пересчета всего графа, что позволяет работать с постоянно растущими потоками данных.
- Использует гибридный поиск: семантический (cosine similarity), полнотекстовый (BM25), графовый traversal и cross-encoder reranking для точности и разнообразия результатов.
- Позволяет настраивать собственную онтологию сущностей через Pydantic модели.
- Универсален по интеграции: поддерживает Neo4j, FalkorDB, Kuzu, Neptune и разные LLM-провайдеры (OpenAI, Anthropic, Gemini).
Как работает Graphiti
Каждое взаимодействие — это эпизод, который проходит цепочку:
- Извлечение сущностей и отношений.
- Инкрементальное добавление в граф знаний с учётом временной валидности (valid_at/invalid_at).
- Возможность гибридного поиска как с LLM, так и без него, используя математические и графовые методы.
- Би-темпоральная модель: система различает время события (reference_time), время поступления данных (created_at) и период актуальности (valid/invalid).
Отличия от GraphRAG и подобных систем
Отличие от GraphRAG и RAG
- RAG: статичные документы, быстрое внедрение на готовых данных, фокус на полнотекстовой семантике.
- GraphRAG: анализ больших документарных корпусов, иерархические summary, глобальные инсайты.
- Graphiti: динамическая память, временной контекст, факт-ориентированный граф с temporal edges, гибридный поиск без LLM и с LLM.
Когда использовать Graphiti
- Постоянно обновляемые данные и взаимодействия с долговременной памятью.
- Исследовательские запросы с учётом временного контекста.
- Контекстный поиск по накопленному опыту команды и корпоративной памяти.
- Делегирование AI-ассистенту поиска достоверной информации из базы.
- Сохранение правил работы, разборов ошибок, саммари сессий с агентами.
Гибридный поиск без LLM:
Когда использовать что?
RAG подходит для:
- Поиск по документам и FAQ
- Статичные корпоративные знания
- Быстрое внедрение на готовых данных
GraphRAG подходит для:
- Анализ больших статичных документарных корпусов
- Исследовательские вопросы о статичных данных
- Когда нужны глобальные инсайты
Graphiti подходит для:
- Взаимодействия с долговременной памятью и принятыми решениями
- Исследовательские вопросы о данных
- Системы, где данные постоянно обновляются
- Поиск по документам и FAQ
- Когда важен временной контекст
Graphiti — это попытка создать для AI то, что человеческая эпизодическая память представляет для нашего мышления: динамическую, контекстную, темпорально-осознанную систему знаний.
На практике:
Graphiti не бесплатен и требует API-ключи, а также VPS с 2 CPU и 4 GB 100gb ssd RAM в минималке.
При этом вы получаете полноценный MCP-сервер, который служит прослойкой для подключения агентов — то есть готовую инфраструктуру для ваших AI-асcистентов
Для максимальной эффективности используйте крупную модель gpt5-high-fast, среднюю gpt5-high-fast и эмбеддинги text-embedding-3-large. Такая конфигурация позволяет обрабатывать данные быстро и точно, минимизируя ошибки AI и нарушения структуры.
Что бы сохранить накопленные знания гарантированно, арендовал впс для графити стека
Закрыл порты, добавил авторизацию, сконфигурировал композ стек (все промтами)
В claude code MCP подключил примерно вот так:
Мне пришлось форкнуть графити и сделать патч добавляющий нового LLM провайдера, что бы значительно экономить на токенах
В процессе разработки просто прошу клода что-то зафиксировать в графити памяти или кидаю ему целые документы или самари.
Но есть лимиты на размер, войну и мир одним промтом не загрузить
Например в течении двух месяцев я писал доки, делал агентов для клода, выстраивал воркфлоу и часто в прошлом добавлял ту инфу в графити, ту что уже не актуальна сейчас. Несмотря на устаревшие записи, Graphiti корректно отвечал на вопросы о процессах разработки — что показало надёжность и силу эпизодической памяти
Графити хорошо отработал в ответе на вопрос о том как должны работать программисты у нас в проекте. скрин
После использования add_memory данные обрабатываются несколько минут в фоне, после чего их можно искать и использовать в запросах. Это позволяет делегировать поиск AI и не держать все знания в голове или переполнять контекст
На скринах виден юзкейс когда можно делегировать поиск инфы, что бы не писать путь до файла с доками или самому надиктовывать то что уже давно у вас в голове является стандартом
Еще можно попросить клода опросить графити по S.M.A.R.T. технологии.
Пример на скрине:
Практические сценарии:
- Делегирование поиска информации AI ассистенту с гарантией достоверности, ведь ты сам просил добавить что-то в базу чуть рпньше
- Построение корпоративной памяти для проектных команд
- Контекстный поиск по накопленному опыту разработки
- Гружу в нее транскрипции саммари созвонов людьми
- В одной базе можно держать несколько проектов, но не рекомендую, лучше через некий роутер держать стек из нескольких разных доменов
- Сохраняю правила работы, запреты, разборы ошибок агента
- Сохраняю саммари важных сессий с ии агентами что бы делать исследования максимально не/эффективных промтов или лучших практик в проекте