Python-модуль для RAG без лишней магии: SQLite, PGVector, Qdrant и минимум зависимостей
Большинство современных RAG-фреймворков становятся всё тяжелее.
Они требуют:
- сложной конфигурации;
- десятков зависимостей;
- обязательного использования LLM почти на каждом этапе;
- собственной экосистемы.
Но в production всё чаще нужен противоположный подход:
- предсказуемость;
- минимализм;
- возможность встроиться в существующую архитектуру;
- контроль над retrieval.
Именно под это был сделан rag-orchestrator.
Что это такое
Это lightweight Python orchestration-модуль для RAG-систем.
Проект ориентирован не на “магический AI framework”, а на:
- простую интеграцию;
- модульность;
- database-agnostic архитектуру.
Поддержка нескольких БД
Модуль рассчитан на работу с:
- SQLite;
- PGVector;
- Qdrant.
Причём через абстрактный слой.
Это означает, что backend можно менять без переписывания логики пайплайна.
Плагинная архитектура
В проекте есть абстракции для:
- Embeddings;
- Retrievers;
- Cleaners;
- processing stages.
Можно подключать:
- собственные embeddings;
- свои retriever-реализации;
- кастомные preprocessing-модули;
- внешние сервисы.
Минимум LLM
Интересная особенность проекта:LLM используется только на одном этапе.
Остальная часть пайплайна работает без обязательной зависимости от модели.
Это даёт:
- меньшую стоимость;
- лучшую воспроизводимость;
- более предсказуемое поведение;
- более простую отладку.
Минимум параметров
Модуль специально спроектирован так, чтобы требовать минимальное количество входных параметров.
Без гигантских YAML-конфигов и сложных dependency chains.
Тесты и примеры
В репозитории уже есть:
- готовые примеры;
- integration tests;
- scripts для проверки работы.
Это упрощает внедрение и изучение системы.
Для чего подходит
Проект можно легко встроить в:
- существующие RAG-пайплайны;
- enterprise AI;
- internal search systems;
- локальные AI-решения;
- backend-инфраструктуру.
Без необходимости переписывать архитектуру под очередной AI framework.
Установка
pip install ragflow-orchestrator
Сегодня orchestration и retrieval всё больше становятся инфраструктурной задачей, а не задачей prompt engineering.
И lightweight-решения вроде этого начинают выглядеть намного практичнее тяжёлых AI ecosystem-комбайнов.