Надоело, что AI «галлюцинирует». Сделал AI-аналитика, который проверяет каждый факт и ссылается на источники.

Надоело, что AI «галлюцинирует». Сделал AI-аналитика, который проверяет каждый факт и ссылается на источники.

Иногда хочешь просто проверить гипотезу по рынку - а заканчиваешь тем, что тратишь три дня на Google и не уверен ни в одной цифре. Так я закодил «Базис» - ai-basis.ru - AI-аналитика, который пишет отчёты с пруфами и которому я, наконец, могу доверять.

Всем привет! Три живых примера отчётов можно сразу потыкать на главной, а здесь расскажу, в чём суть.

Последнее время по работе (и для своих пет-проектов) мне постоянно нужно «копать» новые ниши: какой объём рынка, кто конкуренты, какие тренды.

Я пробовал всё, и везде был болезненный компромисс:

  1. ChatGPT / Perplexity: Быстро, но страшно. Галлюцинирует, путает цифры, выдумывает источники. Для принятия решений, от которых зависит бюджет, — неприменимо.
  2. Агентства / Консалтинг: Надёжно, но это недели ожидания и бюджеты в сотни тысяч рублей. Для быстрой проверки гипотезы — не вариант.
  3. Руками: Дёшево, но это 2-3 дня рутинного «копипаста», сведения табличек и попыток понять, какой источник врёт, а какой нет.

Что это значит? Пришло время ломать этот компромисс!

Про формат

Были мысли сделать простого бота, но аналитика - это не просто ответ, это диалог. Поэтому я остановился на связке Web-app + Интерактивный отчёт:

  • Пользователь должен видеть отчёт целиком, как на дашборде.
  • Он должен кликать на источники и мгновенно их проверять.
  • Он должен задавать уточняющие вопросы прямо по тексту.

Разработка (и в чём "секретный соус")

Это не просто «промпт + GPT-4o». Живём в удивительное время, но магии пока нет. Чтобы побороть галлюцинации, пришлось выстроить трёхступенчатый пайплайн:

  1. Шаг 1. Сбор: AI-агент сканирует тысячи источников (новости, отчёты, TAdviser, РБК и т.д.) и ранжирует их по авторитетности, отсеивая «мусор».
  2. Шаг 2. Верификация: Ключевой этап. Система берёт факты из разных источников (например, "Объём рынка ERP = 90 млрд") и перекрёстно их проверяет. Факт попадает в отчёт, только если он подтверждён несколькими независимыми источниками.
  3. Шаг 3. Диалог: Уже готовый, верифицированный отчёт загружается в RAG-модель. Это позволяет AI-ассистенту отвечать на вопросы только на основе проверенных данных, а не выдумывать.

Интересные функции

1. Доказуемая точность (Главная фича)

На каждый факт, цифру или цитату в отчёте стоит тег [1]. Нажимаешь - и мгновенно видишь, откуда это взято, кто источник и какая у него оценка достоверности (зелёный кружок - высокая, жёлтый — средняя, и т.д.). Никаких «trust me bro».

2. Интерактивный диалог

Отчёт - это не PDF. Это рабочая область. Можно выделить любой абзац и нажать "Спросить про это". Или просто в чате AI-ассистента попросить "Перечисли риски для бизнеса" или "Добавь в таблицу данные по Yandex Market". Ассистент сделает это на лету, опираясь только на собранные данные.

3. Бенчмарк

Я заморочился и прогнал движок по открытому бенчмарку RACER (он как раз для оценки качества исследовательских отчётов). Результат порадовал: мой движок показал 96% точности против 6% у Perplexity. Это к вопросу о качестве «глубокого» ресёрча.

Планы на развитие

Сейчас на сайте лежат три больших демо-отчёта, чтобы можно было «потыкать». Следующий шаг - превратить отчёт в «пластилин».

Идея в том, чтобы вы могли работать с отчётом совместно с AI:

  • Кинуть боту ссылку на новый отчёт и сказать: «Проверь этот источник и интегрируй его данные в наш анализ».
  • Сказать: «Исключи источник X, я ему не доверяю» или «Найди ещё данные по теме Y».
  • Попросить: «Пересобери раздел 3, сфокусируйся на финансовых показателях».

То есть, это уже не «заказ» отчёта, а живой, итеративный процесс работы с AI-аналитиком над документом.

Чем помочь? (Тарифы и фидбек)

Сейчас все демо-отчёты на сайте ai-basis.ru полностью бесплатны, можно зайти и пользоваться.

Основная идея — сделать профессиональный анализ доступным. Дать рынку инструмент, который по качеству приближается к дорогому консалтинговому агентству, но по скорости (и цене) - к AI-ассистенту.

Пока финансирую расходы на API и инфраструктуру сам, но в будущем, очевидно, это freemium-модель: демо-отчёты и базовый анализ - бесплатно, а кастомный «глубокий» анализ по вашей теме - по подписке.

Буду дико благодарен за фидбек!

Переходите на ai-basis.ru, «потыкайте» три демо-отчёта и напишите в комментариях:

  1. Что первым делом сломалось / показалось неудобным?
  2. Какого отчёта/темы вам не хватило для теста?
  3. Готово ли это, по-вашему, к freemium-модели или пока «игрушка»?

Всё читаю. Спасибо!

Начать дискуссию