Цифровизация Германии. Часть 4. Текстовый AI-агент
Настоящая цифровизация — это когда ИИ начинает продавать за Вас.
На финальном этапе модернизации немецкой компании я приступил к разработке ИИ-агента или ИИ-ассистента. Параллельно было запущено сразу два формата: текстовый и голосовой. Про второго ассистента, отвечающего на звонки и обзванивающего клиентов, поговорим в следующей статье, а сейчас сконцентрируемся на первом. Тем более что "мозг" у них общий.
Пара напоминаний о компании. Мы — сеть языковых интеграционных школ в Баварии. Наши клиенты — люди со всего мира, переезжающие в Германию или планирующие переезд в будущем. Это очень неоднородная аудитория: носители разных языков из разных культур. Далеко не всегда менеджеру и потенциальному студенту удаётся понять друг друга. Коммуникацию также осложняет бюрократичность всех немецких процессов и языковой барьер. Тут на помощь приходит универсальность искусственного интеллекта.
Почему ИИ-ассистент лучше живого менеджера:
- Мультиязычность Каким бы талантливым билингвом ни был живой сотрудник, современный ИИ будет говорить (в данном случае — писать текст) гораздо грамотнее и понятнее. Его возможности выходят за границы языков, которыми владеют люди. Средний сотрудник в компании является носителем 2–3 языков. Например, немецкий и русский нативно + английский дополнительно, или русский и украинский нативно + немецкий дополнительно. Но, как вы понимаете, "на том конце провода" вас тоже должны понимать. А клиенты приходят со всего мира и не всегда владеют каким-то из мировых языков. Но даже если бы и владели, всё равно условному студенту из Ирана комфортнее получить развёрнутый ответ на родном фарси, а не на немецком, который он только начал учить.Да и сами секретари, рассказывая о курсах, по сути, выполняют роль продавцов в компании. Я думаю, каждый, кто работал в продажах, понимает, что хороший продавец должен хорошо владеть языком, чтобы подобрать правильный аргумент и преподнести товар с лучшей стороны. Этого очень трудно добиться, когда язык, на котором приходится продавать, для тебя не родной.
- Мультикультурность Дополняет предыдущий пункт. Язык определяет сознание и является проводником культуры. Мало просто знать слова и грамотно конструировать их в предложение. Нужно ещё и чувствовать контекст, в котором находятся его носители. Короче говоря, не получится просто дословно перевести с немецкого на арабский рекламный слоган и получить тот же результат. ИИ-агент знает такие нюансы на уровне глубоко погружённого в культуру человека и потому достигает лучших результатов.
- Мультизадачность Помимо мгновенного переключения между языками в рамках одного диалога, агент также может "жонглировать" десятками инструментов. Он запишет вас на пробный урок, вышлет напоминание на вашу электронную почту, сгенерирует все нужные документы, внесёт данные в CRM и уведомит обо всём менеджера через сообщение в мессенджере. И всё это он сделает быстрее, чем живой секретарь успеет записать ваши ФИО в табличку.А ещё он работает с неограниченным количеством клиентов одновременно. Даже в выходные. Даже ночью.
- Дешевизна Это особенно хорошо видно при больших объёмах лидов. Стоимость затраченных токенов и подписок на разные сервисы кратно меньше заработной платы сотрудника, особенно в Германии. При этом производительность такого ИИ-ассистента гораздо выше. Главное — загружать его достаточным количеством лидов и предварительно хорошо обучить (сделать fine-tuning).
Вообще ИИ-агента можно было отнести к банальной автоматизации из прошлой статьи, но всё-таки искусственный менеджер, обрабатывающий заявки от клиентов и закрывающий их на сделку, — это нечто большее, чем просто webhook, отправляющий сообщение в чат. Не так ли?
Где сейчас работает текстовый ИИ-агент:
- Telegram
Куда его можно добавить в будущем:
- В чат на сайте
- В мобильное приложение
Самая прелесть в том, что агент легко масштабируется и начинает осваивать новые инструменты, базируясь на одной и той же векторной базе данных. Главное — постоянно "дообучать" нейронку.
Кстати, о базе данных. Её пришлось собирать буквально по кусочкам. Как я писал в первой части этой серии статей, наш веб-сайт стал основой для будущей БД. С него были взяты все материалы, которые пришлось структурировать по разным категориям и языкам.
Конечно, нельзя "свалить" все тексты в один файл и загрузить в нейронку с промптом ссылаться на него при каждом ответе. Сначала все материалы разбиваются на категории (школы, курсы, команда и т. д.). Каждая категория в своём собственном PDF или MD файле строго структурируется (заголовок, подзаголовок, описание, цена, продолжительность и т. д.). Для каждого файла существует 4 языковые версии. Это, кстати, очень важный момент, и вот почему. Английский язык самый распространённый в интернете. На нём заоблачное количество пригодного для обучения контента, на котором натаскивают нейронки. Ещё английский язык имеет строгую структуру. Поэтому база данных на английском лучше всего читается нейронками. Вероятность двузначных трактовок сильно снижается. Немецкий тоже имеет строгий порядок слов, и на нём есть большое количество технической документации и инструкций. Всё это также снижает вероятность неправильного понимания данных. Русский и испанский — гораздо более гибкие языки. В них нет такой строгой структуры, но есть большое количество двойных смыслов и игры слов. Это качество отлично подходит в литературе, но очень мешает обучению языковых моделей.
Так почему не создать базу данных только на английском, если он лучше всего подходит для нейросетей?
В таком случае нейронка будет сама переводить имеющиеся данные на другие языки и в процессе перевода терять точность. А если предоставить ей готовый и максимально корректный перевод, скажем, на испанский язык, то и её ответы на испанском будут полагаться на эти "подтверждённые" данные. Таким образом, диалог с клиентом на английском, немецком, русском или испанском будет предельно качественным и соответствующим векторной базе. Диалог на всех остальных языках будет базироваться на среднем значении всех четырёх языковых файлов.
В общем, было потрачено большое количество времени и сил на корректное внесение данных и перевод с участием носителя.
Зато потом процесс очень ускоряется. Файлы подгружаются в векторную базу данных и становятся "мозгом" наших голосового и текстового ассистентов. На создание дополнительных файлов с общей информацией тратится значительно меньше времени, а дообучение нейронки до уровня квалифицированного специалиста происходит регулярно на основе транскрипций состоявшихся диалогов.
Это, кстати, отдельная головная боль. Telegram и WhatsApp агенты подключаются и работают по-разному. Если в "Телеге" всё делается в два клика через создание нового бота, то детище Цукерберга открывает портал в ад. Meta Business — дико запутанная платформа, и пользовательский путь там не всегда очевиден. Пришлось потратить много времени на подключение и полную верификацию аккаунта WhatsApp для диалога от лица ИИ-Агента. С другой стороны, в WhatsApp пользователь думает, что с ним сразу ведёт диалог человек, в то время как в Telegram нужно запускать бота и осознанно говорить именно с ним. Это отсекает немало людей, не желающих получать шаблонный ответ. Ещё боты в Telegram не показывают диалог с клиентом, и трудно провести работу над ошибками. Но все перечисленные проблемы поправимы. Стоит лишь немного заморочиться, и "Телега" становится ультимативной платформой для продаж. Например, диалоги с каждым клиентом сейчас записываются в отдельные файлы для последующего анализа.
Ещё наш ИИ-ассистент отвечает не только на текстовые, но и на аудиосообщения. Он также анализирует фото и документы, отправленные клиентом. Это хорошо работает в обоих мессенджерах. При желании можно было бы и отвечать так же в формате аудио, но мы решили, что это лишнее.
В процессе беседы ИИ-агент не только отвечает на общие вопросы и выполняет продажу, он также:
- записывает клиентов на пробные уроки;
- вносит клиентов в CRM-систему;
- отправляет электронные письма;
- уведомляет администраторов в рабочем чате;
- переводит клиента на "живого" менеджера в случае необходимости;
- расшифровывает аудиосообщения;
- анализирует фотографии и документы;
- ведёт протоколирование разговора для последующего анализа.
На данный момент я использую Pinecone.io в качестве векторной базы данных, и он меня вполне устраивает. Но после недавнего просмотра интервью основателя Qdrant Андрея Васнецова, которое он дал Елизавете Осетинской, появилось сильное желание перейти на Qdrant. Уж очень понравился взгляд Андрея на поиск данных.
Конечно, нужно много чего полировать и развивать в текущем ИИ-Агенте. Пока он обкатывается на ограниченном количестве клиентов. Я стараюсь снизить до минимума количество галлюцинаций (ошибочных, выдуманных ответов) и затем перевести на него 100% клиентской базы для онлайн- и офлайн-курсов. Но уже сейчас нагрузка на секретарей снизилась, и они вступают в диалог, только когда языковая модель сталкивается с чем-то, чего нет в её базе знаний. Уже до конца 2025 года она сэкономит нам минимум несколько тысяч евро на зарплатах и сгенерирует прибыль в десятки тысяч. Дальше — только больше.
На следующей неделе обсудим голосового ИИ-агента на той же базе, который отвечает на звонки и обзванивает клиентов, создавая полное ощущение живого человека.