Одна из основных проблем при использовании больших языковых моделей это практически неустранимые галлюцинации, возникающие при ответах на вопросы по загруженным документам. Задача "поговорить со своими документами" возникает очень часто, и как правило, она решается с помощью промптинга - вы загружаете вашу статью, договор или другой документ и пишете промпт "Ответь на вопрос по тексту:". Этот способ работает, но у него есть существенные недостатки: размер документа ограничен 1-3 страницами, рандомное возникновение галлюцинаций - неправильных ответов, выглядящих правдоподобно.
А что с безопасностью данных?
У нас стандартные для таких сервисов правила по сохранности и конфиденциальности данных:
1. Все данные хранятся у нас на серверах в обезличенном виде. При желании Вы можете удалить ранее загруженные документы.
2. Для обучения генеративных моделей Ваши данные НЕ используются.
3. В пользовательском соглашении в п. 8, сказано, что Вы обязуетесь не загружать документы содержащие персональные данные.
4. Для обработки конфиденциальной информации Вы можете заключить с нами договор по установке этой системы в Ваш закрытый контур. Также возможно дообучение на Ваших данных, для получения более точных ответов.
А чем отличается от Assistants от openai?
Я думаю ваш вопрос о туле (OpenAI-hosted tools) как раз для цели ответов по документам - Knowledge Retrieval:
https://platform.openai.com/docs/assistants/tools/knowledge-retrieval
Цитирую их описание того как этот тул работает:
"
Retrieval augments the Assistant with knowledge from outside its model, such as proprietary product information or documents provided by your users. Once a file is uploaded and passed to the Assistant, OpenAI will automatically chunk your documents, index and store the embeddings, and implement vector search to retrieve relevant content to answer user queries.
"
То есть их Knowledge Retrieval работает ровно так, как у нас описано в статье в разделе "Недостатки Retrieval-Augmented Generation" - то есть они нарезают текст на чанки, а затем используют векторную базу для ответов по ним - и потому это и работает плохо.
В общем проблема фундаментальная - тк в интернете только этот способ и представлен из-за его простоты видимо. К сожалению он дает очень плохие результаты, и непредсказуемые. И все сервисы которые мы нашли они работают так же, просто не упоминая в своих маркетинговых материалах на сайте о качестве ответов.
Мы об этом писали еще в разборе на Хабре: https://habr.com/ru/articles/728410/