{"id":14290,"url":"\/distributions\/14290\/click?bit=1&hash=bece6ae8cf715298895ba844b6416416882fe02c5d18dab2837319deacd2c478","title":"\u041a\u043e\u0440\u043f\u043e\u0440\u0430\u0446\u0438\u0438 \u043a\u0430\u043a \u043d\u0438\u043a\u043e\u0433\u0434\u0430 \u0440\u0430\u043d\u044c\u0448\u0435 \u0445\u043e\u0442\u044f\u0442 \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u0447\u0430\u0442\u044c \u0441 \u043c\u0430\u043b\u044b\u043c \u0431\u0438\u0437\u043d\u0435\u0441\u043e\u043c","buttonText":"","imageUuid":""}

ChatGpt на вашем ПК (работа с докуменами и файлами)

Сегодня я хотел бы поделиться с вами обзором новой системы RAG (Retrieval-Augmented Generation) на основе нейронных сетей, которая позволяет создать свой личный чат-бот (Private GPT) с использованием ваших собственных документов.

Ранее я уже писал про то, как запустить нейронку от Google «Gemma» на своем ПК. Но этот способ еще интереснее. Эта технология очень перспективна, так как позволяет создавать персональных помощников прямо на вашем ПК, знающих ваши предпочтения и особенности работы.

Среди плюсов Private GPT+RAG я бы отметил лёгкую настройку и использование. Достаточно лишь загрузить документы в специальное хранилище и задать нейросети вопрос. Модель сама произведёт индексацию данных и найдёт ответ.

Кристиан Акила

Я протестировал три приложения с поддержкой RAG: Chat For All, priv GPT и H2O. Все они имеют свои плюсы и минусы.

Но GPT4ALL отлично справился с поиском информации в загруженных документах, хотя ответы иногда были не совсем точными.

Инструкция по установке

Вот пошаговая инструкция по установке и настройке gpt4all на свой ПК, всё как вы любите!

ШАГ 1: Скачайте приложение Gpt4all для windows, Ubuntu или MacOS

ШАГ 2: В открывшемся окошке скачайте 2 модели Sbert и Nous Hermes 2 Mistrall DPO.

Загрузка нужной модели в Gpt4all

ШАГ 3: Нажмите на "Local Documents", далее Add & Remove и в первом окошке выберите папку, в которой будете загружать документы на анализ.

Создание папки с документами

ШАГ 4: В созданную (добавленную) папку, загрузите документы для анализа.

ШАГ 5: На главной выберете модель Nous Hermes 2 Mistrall DPO и наслаждайтесь локальным ChatGpt.

Работа локального Gpt с обработкой документов

В качестве примера я загрузил в папку текстовый документ, в котором написал следующее: Лунные гризли это выдуманное существо. Лунные гризли любят мрамор и обитают на луне. Их мех стоимостью 100 рублей, продается на марсе. А их зубы прочны как алмазы.

Вот такой диалог вышел в итоге:

Chat For All отлично справился с поиском информации в загруженных документах, хотя ответы иногда были не совсем точными. Это связано с особенностями работы RAG, когда языковая модель добавляет некоторый свой контекст, если не находит точную цитату в документах.

Если хотите чтобы я написал про более точную модель, которая показала феноменальные результаты, пишите в комментариях. Сделаю новый пост. Она дала абсолютно верные ответы на все мои вопросы по загруженному тексту.

Ну и если что-то не получается с инструкцией выше, тоже пишите вопросы, отвечу быстро.

0
8 комментариев
Написать комментарий...
Ирина Вергун

обычно когда ставишь на свой ПК модель не поддерживает контекст

Ответить
Развернуть ветку
Кристиан Акила
Автор

Это не совсем соотвествует действительности. Поддержка истории (контекста) на сколько я понимаю на тек. момент, скорее лежит на оболочке, чем на модели. Например GPT4ALL это оболочка, а Nous Hermes 2 Mistrall DPO это уже модель.

Ответить
Развернуть ветку
Ирина Вергун

может быть, я не очень разбираюсь, пробовала ставить несколько сборок с гитхаба, работает не очень

Ответить
Развернуть ветку
Виктор Петров

Тут история сохраняется, есть настройка.

Ответить
Развернуть ветку
Виктор Петров
Nous Hermes 2 Mistrall DPO

Почему именно она и есть ли что-то вместо?

Ответить
Развернуть ветку
Кристиан Акила
Автор

Можно поставить любую совместно со Sbert, именно он обрабатывает файлы.

Ответить
Развернуть ветку
Владимир Ракитин

Сделал по примеру, как здесь описан. Очень медленно отвечает 40 секунд обрабатывает и потом выдает ответ. Можно как в статьей вашей сделать? за счет чего?

Ответить
Развернуть ветку
Кристиан Акила
Автор

Тут могут быть 2 причины. Первая "Глюки", решаются перезагрузкой программы gpt4all. Или сменной модели. Вторая причина это слабый ПК или видеокарта. Прога использует видеокарту для обработки. У меня RTX 3070ti и обработка довольно быстрая. Примерно как chatgpt от openai.

Ответить
Развернуть ветку
5 комментариев
Раскрывать всегда