Как запустить корпоративный GPT на opensource-проектах. Без VPN и дообучения

В 2024 году нет необходимости кого-то убеждать в том, что интеграция AI в бизнес-процессы — это критическая необходимость для выживания бизнеса в будущем. AI-ассистенты способны ускорить и увеличить эффективность вашу и ваших сотрудников, а иногда и вовсе заменить «средних» специалистов.

OpenAI - все еще удерживает лидерские позиции, но ему уже наступают на пятки - Claude 3, Google(Gemini), а главное - появляются все более и более мощные open source модели - LLAMA2, Mixtral, и целое семейство на hugging face.

Основные юзкейсы для бизнеса

Для клиентов:

Генерация контента
Автоматизация customer support Q&A боты для клиентов
автоматизация бизнес процессов

Для сотрудников:

Q&A боты для сотрудников
Онбординг
Документ драфтинг
Суммаризация и поиск информации в документах
Ассистенты интегрированные с внутренними CRM, ERP

ChatGPT со своей экосистемой ассистентов позволяет постросить подобные решения. В том числе загрузить свои документы как базу знаний, интегрировать ассистенты с внутренними системами и тд. Однако встает вопрос по защите корпоративных данных и вообще получения доступа в реалиях блокировок и ограничений. Благо, бум генеративного AI сопровождается бумом open source моделей, UI, API wrappers и тд.

В этой статье мы рассмотрим как организовать доступ к таким ассистентам для сотрудников. Будем рассматривать только opensource решения 🙂

Для начала просто рассмотрим проекты, а потом уже расскажем как можно их скомбинировать исходя из юзкейса.

LocalAI

Как запустить корпоративный GPT на opensource-проектах. Без VPN и дообучения

https://localai.io/

Этот проект в первую очередь позволяет развернуть OpenAI совместимый API, за которым можем стоять локальная модель. Также это может работать как прокси API к OpenAI - чтобы работать без VPN. Таким образом, этот проект нужен если хотим развернуть локальную модель и хотим OpenAI совместимый API. Один из плюсов - они также поддерживают tools, function calling(то есть opensource модели можно интегрировать с внутренними CRM, ERP), генерация изображений, аудио.

Для запуска локальной модели желательно иметь сервер с GPU.

Chatbot UI

https://github.com/mckaywrigley/chatbot-ui

Просто веб интерфейс, который очень похож на ChatGPT, и который вы можете развернуть на своей инфраструктуре. Поддерживает модели OpenAI, Anthropic, Google Gemini, Mixtral

PrivateGPT

https://github.com/imartinez/privateGPT

PrivateGPT is a production-ready AI project that allows you to ask questions about your documents using the power of Large Language Models (LLMs), even in scenarios without an Internet connection. 100% private, no data leaves your execution environment at any point.

Загрузите свои документы и получите бота, который способен отвечать на вопросы, ссылаясь при этом на эти документы. Пожалуй лучший open source проект для кейса, когда нужно превратить инструкции для сотрудников в Q&A бота. Также огромный плюс - что они также поддерживают OpenAI совместивый API, который под капотом будет делать RAG по вашим документам).

BIG-AGI

https://github.com/enricoros/big-agi

BIG-AGI 🧠✨Welcome to big-AGI 👋, the GPT application for professionals that need function, form, simplicity, and speed. Powered by the latest models from 12 vendors and open-source model servers, big-AGI offers best-in-class Voice and Chat with AI Personas, visualizations, coding, drawing, calling, and quite more -- all in a polished UX.

Это в первую очередь просто веб интерфейс для большого количества моделей, но с более мощным функционалом чем Chatbot UI. С интеграцией с внешними инструментами - может гуглить, загружать веб страницы, делать ReAct. Также поддерживаются модели по генерации изображений. Другая особенность - “AI Personas” - ассистены для разных задач(Пока что довольно сложно настраивать своих, но вы можете делать своих персон со своими системными промтами)

Telegram бот

https://github.com/n3d1117/chatgpt-telegram-bot

Можете запустить свой телеграм бот, даже несколько для разных задач. Например, можете сделать асистентов с разным system prompt для разных задач. Опять таки, за телеграм ботом может быть просто ваш ключ к OpenAI, а может быть ваша локальная модель запущенная с помощью LocalAI

Указанные выше проекты легко и быстро запускаются в Docker. Используя их, вы можете собрать решение под свои задачи.

Ниже я приведу примеры комбинаций под разные задачи.

Для запуска вам может потребоваться:

OpenAI аккаунт(ключ), который вы можете оплачивать
VPS - виртаульный сервер(желательно где-нибудь в европе, например в timeweb)
GPU сервер - сервер с видео картой. Можете рассмотреть цены на Yandex Cloud или запуск на своем железе

Для начала самый простой случай, когда вам нужно настроить доступ к LLM общего назначения и без всякой специализации.

Варианты комбинаций:

OpenAI аккаунт, VPS, Chatbot UI/BIG-AGI - если нужен веб интерфейс
OpenAI аккаунт, VPS, Telegram bot
GPU сервер, LocalAI, Chatbot UI/BIG-AGI
GPU сервер, LocalAI, Telegram bot

Как превратить инструкции для сотрудников в бота, который способен отвечать на вопросы?

Часто эту задачу называют “дообучение на своих данных”. Чаще всего вам не нужно дообучение(это дорого и не так эффективно), вам нужно предоставить качественный контекст(см. RAG) из своих данных для LLM.

Варианты комбинаций:

OpenAI аккаунт, VPS, PrivateGPT
OpenAI аккаунт, VPS, PrivateGPT, Chatbot UI/BIG-AGI
OpenAI аккаунт, VPS, PrivateGPT, Telegram bot
GPU сервер, PrivateGPT
GPU сервер, LocalAI, PrivateGPT

Этот тот случай, когда мы можете создать много ассистентов решающих узко-направленные задачи. При этом, вся логика описана в system promt. Тот самый случай, когда какую-то инструкцию для сотрудника по выполнению определенной задачи(например, подготовки документа, технической конфигурации и тд) можно заменить ботом, который помогает сотруднику эту задачу выполнить гораздно быстрее и проще. Например, в reputation.ru есть ассистент, который генерирует kubernetes манифесты для публикации приложений, уточняя у разработчика все необходимые детали приложения.

OpenAI аккаунт, VPS, Telegram bot
OpenAI аккаунт, VPS, BIG-AGI(сделать кастомную “AI persona”)
GPU сервер, LocalAI, Telegram bot
GPU сервер, LocalAI, BIG-AGI(сделать кастомную “AI persona”)

Часто вижу что компании хотят сделать свою LLM заточенную под их предметную область и часто ошибочно полагают что дообучение существующих foundation models это правильный путь. В тоже время их задачу может решить промпт инжиниринг или качественный контекст(RAG).

Bloomberg потратил $10 миллионов чтобы дообучить и сделать BloombergGPT заточенную под финансовые задачи. Через две недели вышла GPT4, которая превзошла их модель на тех самых финансовых задачах без всякого finetuning.

Поэтому лучше:

Получите доступ к одной из foundation models(OpenAI, Claude3, Google Gemini или запустите локально Llama 2, Mistral). Моя заметка-сравнение некоторых моделей на русском языке
Поиграйтесь с проптом и разными техниками промпта, попробуйте разбить задачу на несколько этапов, дайте LLM примеры
Дайте LLM доступ к базе знаний через RAG
Сделайте набор тестов и сравните разные модели
Если нужен специфичный стиль выдачи, формат или нужно улучшить поведение модели на сложных "edge cases" - попробуйте finetuning

На последок неплохое видео от OpenAI про то как выжимать максимум из LLM:

https://www.youtube.com/watch?v=ahnGLM-RC1Y&t=291s

Как запустить корпоративный GPT на opensource-проектах. Без VPN и дообучения

Проекты

Как собрать решение под себя

ChatGPT без vpn

Q&A бот

Ассистенты с system prompt

Заключение и мысли про finetuning(дообучение)