30 рублей за заявку вместо 900 000 за отдел: как мы собрали AI-агента для обработки входящих за выходные

30 рублей за заявку вместо 900 000 за отдел: как мы собрали AI-агента для обработки входящих за выходные

Тысяча входящих заявок в месяц — объём, который выжигает менеджера за квартал. AI-агент закрывает 80% из них без участия человека, а обходится в 3–5 тысяч рублей в месяц. Я собрал такого агента за два дня — без единой строчки кода.

Расскажу конкретный маршрут: от пустого экрана в субботу утром до работающего MVP в воскресенье вечером. Со стеком, промптами, граблями и экономикой.

Зачем вообще собирать AI-агента самому

Сначала разберёмся в терминах. Чат-бот — это скрипт: если клиент написал А, бот отвечает Б. AI-агент — это другой уровень. Он читает заявку, понимает контекст, сам решает, что делать: классифицировать как горячий лид, написать персональный ответ, записать данные в CRM и уведомить менеджера — цепочкой, без участия человека.

Конкретный сценарий, который я реализовал:

  1. Входящая заявка приходит из Telegram, email или формы на сайте
  2. Агент парсит текст и классифицирует: горячий лид, вопрос по продукту, спам, сложный кейс
  3. Генерирует персональный ответ клиенту — не шаблон, а осмысленный текст
  4. Записывает данные в CRM
  5. Если кейс сложный — эскалирует менеджеру в Slack или Telegram

Готовые конструкторы вроде Chatbase дают результат за час. Но упираются в потолок при первой нестандартной логике. Нужна своя классификация, свои правила эскалации, свой тон — значит, нужна своя сборка.

Рынок: это не хайп, а новая инфраструктура

Цифры, которые стоит держать в голове:

  • $5,43 млрд — объём рынка AI-агентов в 2024 году (Precedence Research)
  • $236 млрд — прогноз на 2034 год, рост в 43 раза за десять лет
  • 33% корпоративных приложений будут использовать агентный AI к 2028 году (Gartner)

Это не абстрактный enterprise. Обработка заявок — одна из первых задач, где AI-агенты дают измеримый ROI малому и среднему бизнесу.

Минимальный стек: три слоя, ноль кода

Архитектура AI-агента — это три компонента: «мозги» (LLM), логика (оркестратор), хранилище (данные). Для предпринимателя или продакта оптимальный маршрут — no-code через n8n.

n8n — опенсорсный оркестратор с 400+ встроенными интеграциями. Визуальный канвас, AI-ноды на базе LangChain. С 2025 года — тарификация по выполнениям и безлимитные workflows на всех планах.

Что НЕ нужно на старте: vector database, fine-tuning, RAG, LangGraph, собственный сервер. Всё это — следующий спринт. Для MVP за выходные хватит системного промпта и прямых вызовов LLM.

Какую LLM выбрать: практическое сравнение

Для обработки заявок на русском языке критичны три вещи: следование инструкциям, качество русского, поддержка вызова инструментов.

Для no-code маршрута через n8n — Claude или GPT-4o. Оба подключаются в два клика. Open-source — для тех, кто готов поднимать инфраструктуру, но для MVP за выходные это избыточно.

Архитектура: как это работает внутри

Агентный пайплайн выглядит просто:

Триггер (webhook / email / Telegram) → Парсинг входящего сообщения → Классификация (LLM + системный промпт) → Развилка: простая заявка идёт на автоответ и запись в CRM, сложный кейс — на эскалацию менеджеру → Логирование в Google Sheets.

В n8n это реализуется через паттерн Tool Use: LLM получает набор инструментов (записать в CRM, отправить сообщение, эскалировать) и сам решает, какие вызвать. Не нужно прописывать каждую ветку вручную — агент выбирает действия по контексту заявки.

Паттерны ReAct и Chain-of-Thought работают внутри AI-нод n8n автоматически. На практике достаточно грамотного системного промпта и правильно описанных инструментов.

Системный промпт — ядро всего

Плохой промпт превращает агента в галлюцинатор. Хороший — даёт предсказуемый результат на 90%+ заявок.

Анатомия рабочего системного промпта:

  • Роль: кто агент, в какой компании работает, какие у него полномочия
  • Контекст: описание продукта, типичные клиенты, частые вопросы
  • Классификация: чёткие критерии для каждой категории (горячий лид, вопрос, спам, сложный кейс)
  • Инструкции по ответу: тон, длина, что обязательно упомянуть, чего избегать
  • Правила эскалации: когда передавать человеку, с какой информацией
  • Ограничения: что агент НЕ должен делать (обещать скидки, называть цены, которых нет)

Ключевой принцип: промпт должен быть конкретным. Не «будь вежливым», а «обращайся на вы, используй имя клиента, ответ — не длиннее 3 предложений». Чем точнее инструкция, тем предсказуемее результат.

Экономика: сколько это стоит в рублях

Давайте посчитаем для типичного кейса — 1 000 заявок в месяц:

  • LLM API: $3–5 (~300–500 ₽) за 1 000 запросов при средней длине заявки
  • n8n Cloud: €24/мес (~2 400 ₽) на стартовом тарифе
  • Google Sheets: бесплатно
  • Итого: ~3 000–3 500 ₽/мес

Для сравнения: выделенный менеджер на обработке заявок — от 40 000 ₽/мес. Даже с учётом того, что 20% сложных кейсов всё равно уходят на человека, экономия — десятикратная.

Одна обработанная заявка обходится примерно в 30 копеек по API. Тридцать копеек. Даже если добавить стоимость оркестратора — выходит около 3 рублей за заявку.

Грабли, на которые я наступил (чтобы вы не наступали)

1. Слишком общий промпт. Первая версия классифицировала 40% заявок как «сложный кейс» и эскалировала менеджеру. После добавления конкретных примеров в промпт — процент эскалаций упал до 15%.

2. Отсутствие fallback-сценария. Если LLM API недоступен — заявка просто терялась. Добавил ветку: при ошибке API заявка сохраняется в отдельный лист и менеджер получает уведомление.

3. Игнорирование логирования. Без логов невозможно понять, где агент ошибается. Google Sheets как лог — бесплатно и достаточно для первых месяцев.

4. Попытка сразу сделать идеально. Первый день ушёл на выбор между пятью LLM. Правильный подход: взять Claude или GPT-4o, запустить, итерировать по реальным данным.

Что дальше: от MVP к продакшену

MVP за выходные — это начало. Дальше открывается несколько направлений:

  • RAG (Retrieval-Augmented Generation) — подключить базу знаний, чтобы агент отвечал на сложные вопросы по продукту
  • Мультиканальность — один агент обрабатывает заявки из Telegram, WhatsApp, email и формы на сайте
  • Аналитика — дашборд по типам заявок, времени ответа, проценту эскалаций
  • A/B-тестирование промптов — сравнивать конверсию разных формулировок ответов

Но всё это — после того, как MVP проработает неделю-две на реальных заявках. Сначала запустить, потом улучшать.

Я убеждён, что через год-два AI-агенты для обработки входящих станут таким же стандартом, как CRM сегодня. Вопрос не «внедрять или нет», а «когда начать». И выходные — отличный момент для старта.

А вы уже пробовали автоматизировать обработку заявок с помощью AI? Что сработало, а что нет? Делитесь в комментариях.

Подписывайся на Телеграм Вайблаб, чтобы наблюдать за тем, как мы строим AI-first компанию.

Напишите нам напрямую

9
Начать дискуссию