Вышел наш первый публичный релиз FractalGPT QA агента - это более крутой аналог функционала загрузки своих pdf в ChatGPT - можно задавать вопросы по загруженным вами документам.
В частности, с помощью алгоритма Fractal answer synthesis и интерпретируемого ИИ нам удается существенно снизить % галлюцинаций и стабильно сильно повысить точность и полнот…
А чем отличается от Assistants от openai?
Я думаю ваш вопрос о туле (OpenAI-hosted tools) как раз для цели ответов по документам - Knowledge Retrieval:
https://platform.openai.com/docs/assistants/tools/knowledge-retrieval
Цитирую их описание того как этот тул работает:
"
Retrieval augments the Assistant with knowledge from outside its model, such as proprietary product information or documents provided by your users. Once a file is uploaded and passed to the Assistant, OpenAI will automatically chunk your documents, index and store the embeddings, and implement vector search to retrieve relevant content to answer user queries.
"
То есть их Knowledge Retrieval работает ровно так, как у нас описано в статье в разделе "Недостатки Retrieval-Augmented Generation" - то есть они нарезают текст на чанки, а затем используют векторную базу для ответов по ним - и потому это и работает плохо.
В общем проблема фундаментальная - тк в интернете только этот способ и представлен из-за его простоты видимо. К сожалению он дает очень плохие результаты, и непредсказуемые. И все сервисы которые мы нашли они работают так же, просто не упоминая в своих маркетинговых материалах на сайте о качестве ответов.
Мы об этом писали еще в разборе на Хабре: https://habr.com/ru/articles/728410/