Я сделал себе личного ИИ-ассистента в Telegram. Он отвечает голосом, читает доки и сам пишет письма

Однажды я поймал себя на том, что трачу утро не на работу, а на то, чтобы найти письмо двухнедельной давности, вспомнить, когда у меня встреча с Антоном, и понять, что именно было в том PDF, который я загрузил в прошлый четверг.

Три задачи. Сорок минут. Ни одна из них не требует мозга — только время.

Тогда я и решил: хватит.

Как это вообще началось

Я не искал готовое решение. Готовые решения — это подписка на очередной SaaS, который умеет половину из того, что обещает, и требует отдельного логина. Я хотел что-то своё: под мои процессы, с моими данными, работающее там, где я и так сижу весь день — в Telegram.

Взял n8n. Не потому что модно, а потому что там видно, что происходит. Каждый шаг — как на ладони. Никакой магии, только логика.

Поставил себе задачу: ассистент должен принимать голосовые сообщения (потому что печатать руками — это прошлый век), работать с документами, отправлять письма и не путать Антона из отдела маркетинга с Антоном из бухгалтерии.

Как устроена система

Вот что получилось в итоге, если объяснять без схем.

Есть два входа в систему. Первый — Telegram: я пишу или говорю голосом, ассистент понимает оба формата. Голос прогоняется через Whisper, превращается в текст, и дальше обрабатывается как обычное сообщение. Второй вход — Google Drive: когда я загружаю туда новый документ, он автоматически разбивается на куски, превращается в эмбеддинги и уходит в векторную базу Pinecone. Без моего участия.

Дальше всё попадает к агенту — я назвал её Анна, это важно для тона общения — и она решает, что делать с запросом.

Нужно найти информацию из документов? Лезет в базу знаний. Нужно написать письмо? Сначала проверяет контакты — реальный адрес, не выдуманный — потом отправляет через Gmail. Нужно поставить встречу с человеком? Ищет его email, создаёт событие в календаре с приглашением. Не нашла контакт — не угадывает, а спрашивает меня.

Это, кстати, принципиальный момент. Много ИИ-ассистентов начинают галлюцинировать именно здесь — придумывают адреса, ставят встречи в никуда. Я прописал жёсткое правило: нет верифицированного контакта — нет действия.

Что реально изменилось

Первые две недели я ловил себя на странном ощущении. Я диктовал голосом прямо в Telegram: «Анна, напомни мне завтра в 10 позвонить Максиму и найди в доках условия по договору с клиникой» — и это просто работало. Напоминание в календаре. Выдержка из документа. Всё в одном ответе.

Смешно, но больше всего времени я сэкономил не на сложных задачах, а на мелких. Не нужно открывать Gmail, листать папки, копировать адрес. Не нужно искать файл в Drive, открывать его, ctrl+F. Это всё маленькие действия по 2-3 минуты, которые в сумме съедают час.

Ещё один неочевидный плюс: я стал меньше держать в голове. База знаний помнит то, что я туда загрузил. Мне не нужно — и это освобождает.

Что было неочевидно при сборке

Несколько вещей, которые я не предвидел и которые пришлось решать по ходу.

Разбивка документов важнее, чем кажется. Если чанки слишком большие — качество поиска падает, модель теряет контекст. Я остановился на 1200 символах с перекрытием 150 — это для моих документов работает нормально, но под другой контент может потребоваться другая настройка.

Память сессии и память базы знаний — это разные вещи. Window Buffer Memory держит контекст текущего разговора. Pinecone держит знания. Их нельзя смешивать в голове, иначе начинается путаница при отладке.

Промпт агента решает больше половины качества. Я переписывал системный промпт раз пять, прежде чем агент перестал угадывать email-адреса и начал правильно маршрутизировать задачи. Хорошая архитектура без хорошего промпта — это машина без руля.

Что дальше

Сейчас думаю добавить интеграцию с CRM — чтобы после встречи можно было голосом надиктовать заметку, и она автоматически привязывалась к нужному контакту. И хочу научить ассистента проактивно напоминать о незакрытых задачах — не просто отвечать на запросы, но и самому приходить утром с дайджестом.

Это уже другой уровень. Но база есть.

Если интересно посмотреть на саму схему воркфлоу или разобрать какой-то конкретный узел — пишите в комменты, покажу детали. Иногда проще увидеть на живом примере, чем читать описание.

1
Начать дискуссию