Chat For All отлично справился с поиском информации в загруженных документах, хотя ответы иногда были не совсем точными. Это связано с особенностями работы RAG, когда языковая модель добавляет некоторый свой контекст, если не находит точную цитату в документах.
обычно когда ставишь на свой ПК модель не поддерживает контекст
Это не совсем соотвествует действительности. Поддержка истории (контекста) на сколько я понимаю на тек. момент, скорее лежит на оболочке, чем на модели. Например GPT4ALL это оболочка, а Nous Hermes 2 Mistrall DPO это уже модель.
Тут история сохраняется, есть настройка.
Nous Hermes 2 Mistrall DPOПочему именно она и есть ли что-то вместо?
Можно поставить любую совместно со Sbert, именно он обрабатывает файлы.
Сделал по примеру, как здесь описан. Очень медленно отвечает 40 секунд обрабатывает и потом выдает ответ. Можно как в статьей вашей сделать? за счет чего?
Тут могут быть 2 причины. Первая "Глюки", решаются перезагрузкой программы gpt4all. Или сменной модели. Вторая причина это слабый ПК или видеокарта. Прога использует видеокарту для обработки. У меня RTX 3070ti и обработка довольно быстрая. Примерно как chatgpt от openai.