Надоело, что AI «галлюцинирует». Сделал AI-аналитика, который проверяет каждый факт и ссылается на источники.
Иногда хочешь просто проверить гипотезу по рынку - а заканчиваешь тем, что тратишь три дня на Google и не уверен ни в одной цифре. Так я закодил «Базис» - ai-basis.ru - AI-аналитика, который пишет отчёты с пруфами и которому я, наконец, могу доверять.
Всем привет! Три живых примера отчётов можно сразу потыкать на главной, а здесь расскажу, в чём суть.
Последнее время по работе (и для своих пет-проектов) мне постоянно нужно «копать» новые ниши: какой объём рынка, кто конкуренты, какие тренды.
Я пробовал всё, и везде был болезненный компромисс:
- ChatGPT / Perplexity: Быстро, но страшно. Галлюцинирует, путает цифры, выдумывает источники. Для принятия решений, от которых зависит бюджет, — неприменимо.
- Агентства / Консалтинг: Надёжно, но это недели ожидания и бюджеты в сотни тысяч рублей. Для быстрой проверки гипотезы — не вариант.
- Руками: Дёшево, но это 2-3 дня рутинного «копипаста», сведения табличек и попыток понять, какой источник врёт, а какой нет.
Что это значит? Пришло время ломать этот компромисс!
Про формат
Были мысли сделать простого бота, но аналитика - это не просто ответ, это диалог. Поэтому я остановился на связке Web-app + Интерактивный отчёт:
- Пользователь должен видеть отчёт целиком, как на дашборде.
- Он должен кликать на источники и мгновенно их проверять.
- Он должен задавать уточняющие вопросы прямо по тексту.
Разработка (и в чём "секретный соус")
Это не просто «промпт + GPT-4o». Живём в удивительное время, но магии пока нет. Чтобы побороть галлюцинации, пришлось выстроить трёхступенчатый пайплайн:
- Шаг 1. Сбор: AI-агент сканирует тысячи источников (новости, отчёты, TAdviser, РБК и т.д.) и ранжирует их по авторитетности, отсеивая «мусор».
- Шаг 2. Верификация: Ключевой этап. Система берёт факты из разных источников (например, "Объём рынка ERP = 90 млрд") и перекрёстно их проверяет. Факт попадает в отчёт, только если он подтверждён несколькими независимыми источниками.
- Шаг 3. Диалог: Уже готовый, верифицированный отчёт загружается в RAG-модель. Это позволяет AI-ассистенту отвечать на вопросы только на основе проверенных данных, а не выдумывать.
Интересные функции
1. Доказуемая точность (Главная фича)
На каждый факт, цифру или цитату в отчёте стоит тег [1]. Нажимаешь - и мгновенно видишь, откуда это взято, кто источник и какая у него оценка достоверности (зелёный кружок - высокая, жёлтый — средняя, и т.д.). Никаких «trust me bro».
2. Интерактивный диалог
Отчёт - это не PDF. Это рабочая область. Можно выделить любой абзац и нажать "Спросить про это". Или просто в чате AI-ассистента попросить "Перечисли риски для бизнеса" или "Добавь в таблицу данные по Yandex Market". Ассистент сделает это на лету, опираясь только на собранные данные.
3. Бенчмарк
Я заморочился и прогнал движок по открытому бенчмарку RACER (он как раз для оценки качества исследовательских отчётов). Результат порадовал: мой движок показал 96% точности против 6% у Perplexity. Это к вопросу о качестве «глубокого» ресёрча.
Планы на развитие
Сейчас на сайте лежат три больших демо-отчёта, чтобы можно было «потыкать». Следующий шаг - превратить отчёт в «пластилин».
Идея в том, чтобы вы могли работать с отчётом совместно с AI:
- Кинуть боту ссылку на новый отчёт и сказать: «Проверь этот источник и интегрируй его данные в наш анализ».
- Сказать: «Исключи источник X, я ему не доверяю» или «Найди ещё данные по теме Y».
- Попросить: «Пересобери раздел 3, сфокусируйся на финансовых показателях».
То есть, это уже не «заказ» отчёта, а живой, итеративный процесс работы с AI-аналитиком над документом.
Чем помочь? (Тарифы и фидбек)
Сейчас все демо-отчёты на сайте ai-basis.ru полностью бесплатны, можно зайти и пользоваться.
Основная идея — сделать профессиональный анализ доступным. Дать рынку инструмент, который по качеству приближается к дорогому консалтинговому агентству, но по скорости (и цене) - к AI-ассистенту.
Пока финансирую расходы на API и инфраструктуру сам, но в будущем, очевидно, это freemium-модель: демо-отчёты и базовый анализ - бесплатно, а кастомный «глубокий» анализ по вашей теме - по подписке.
Буду дико благодарен за фидбек!
Переходите на ai-basis.ru, «потыкайте» три демо-отчёта и напишите в комментариях:
- Что первым делом сломалось / показалось неудобным?
- Какого отчёта/темы вам не хватило для теста?
- Готово ли это, по-вашему, к freemium-модели или пока «игрушка»?
Всё читаю. Спасибо!