Эффективный подход к Deep Research с Dataroom и локальными моделями

Наткнулся на интересный подход для Deep Research — Dataroom

Где автор Dataroom не видит смысла давать эту работу дорогим моделям (в целях экономии токенов) и предлагает делить эту задачу на две фазы:

1/ Локальная модель ищет в вебе, переранжирует источники и складывает всё в структурированный .zip: папки topics/, sources/, data/, summary md и каждый факт с ссылкой на источник.

Это занимает столько времени, сколько ты задашь, ну например час.

2/ Дальше уже дорогой фронтир-агент Claude/Codex читает эти файлы и работает только по ним. Без веба.

Первый вопрос, который у меня возник — ну ладно, локальная модель (автор советует Qwen3.6-35B-A3B), но она же не стоит рядом с тем же фронтир моделями с которыми мы привыкли и как она вообще будет нормально ресёрчить?

Покапался и понял, что qwen не ресёрчит, eё работа оркестрация инструментов:

• Формулирует поисковые запросы

• Решает какие страницы читать дальше

• Понимает когда тему можно закрывать

• Записывает выжимки в markdown

• Через function calling вызывает инструменты, а не пытается их заменить

А всю работу по поиску в вебе делает Jina CLI, не LLM. Он умеет искать, вытаскивать чистый текст со страниц, ранжировать источники по релевантности и выкидывать повторы, даже если они переписаны другими словами.

Плюс цитирование зашито в сам пайплайн: каждый факт записывается с URL на первоисточник.

Eщё бонус локалки в том, что нет лимита сессий. API Claude обрывает сессию по времени и считает токены.

Qwen на твоём железе только тратит электричество и может крутиться час, два, три. Поэтому ресёрч получается долгим, но именно поэтому и тщательным.

Так что хорошая модель ≠ качественный ресёрч. Качество приходит от пайплайна, а не от мощности модели.

Есть еще Skill для агентов, чтобы они сами запускали Dataroom как API: послал запрос, подождал, скачал zip.

Веб-версия | GitHub

Подписывайтесь на Telegram Tips AI | IT & AI.