Эффективный подход к Deep Research с Dataroom и локальными моделями
Наткнулся на интересный подход для Deep Research — Dataroom
Где автор Dataroom не видит смысла давать эту работу дорогим моделям (в целях экономии токенов) и предлагает делить эту задачу на две фазы:
1/ Локальная модель ищет в вебе, переранжирует источники и складывает всё в структурированный .zip: папки topics/, sources/, data/, summary md и каждый факт с ссылкой на источник.
Это занимает столько времени, сколько ты задашь, ну например час.
2/ Дальше уже дорогой фронтир-агент Claude/Codex читает эти файлы и работает только по ним. Без веба.
Первый вопрос, который у меня возник — ну ладно, локальная модель (автор советует Qwen3.6-35B-A3B), но она же не стоит рядом с тем же фронтир моделями с которыми мы привыкли и как она вообще будет нормально ресёрчить?
Покапался и понял, что qwen не ресёрчит, eё работа оркестрация инструментов:
• Формулирует поисковые запросы
• Решает какие страницы читать дальше
• Понимает когда тему можно закрывать
• Записывает выжимки в markdown
• Через function calling вызывает инструменты, а не пытается их заменить
А всю работу по поиску в вебе делает Jina CLI, не LLM. Он умеет искать, вытаскивать чистый текст со страниц, ранжировать источники по релевантности и выкидывать повторы, даже если они переписаны другими словами.
Плюс цитирование зашито в сам пайплайн: каждый факт записывается с URL на первоисточник.
Eщё бонус локалки в том, что нет лимита сессий. API Claude обрывает сессию по времени и считает токены.
Qwen на твоём железе только тратит электричество и может крутиться час, два, три. Поэтому ресёрч получается долгим, но именно поэтому и тщательным.
Так что хорошая модель ≠ качественный ресёрч. Качество приходит от пайплайна, а не от мощности модели.
Есть еще Skill для агентов, чтобы они сами запускали Dataroom как API: послал запрос, подождал, скачал zip.
Подписывайтесь на Telegram Tips AI | IT & AI.