Сначала архитектура, потом «магия»: наш путь от сценарных голосовых ботов к умным ассистентам

Вокруг голосового ИИ до сих пор существует слишком красивая картинка: подключили LLM* и получили почти «живого» ассистента. На практике в финтехе всё работает гораздо приземленнее.

Переход к умным голосовым агентам — это не просто замена старой системы новой. Это постепенное усложнение архитектуры.

Сначала архитектура, потом «магия»: наш путь от сценарных голосовых ботов к умным ассистентам

Любой голосовой бот сначала строится на очень понятной базе: сценарии, интенты, ключевые слова, маршруты диалога. Дальше команда долго донастраивает систему: смотрит отчеты, корректирует ответы, проверяет логику переходов.

Потом появляются интеграции через API, аналитика, маршрутизация звонков, работа с внутренними сервисами. И только после этого в систему начинают добавлять LLM.

Важно, что модель появляется не вместо архитектуры, а поверх неё.

При этом сценарные боты до сих пор остаются важной частью системы. Особенно в финтехе, где критична предсказуемость: нужно понимать, что именно агент скажет клиенту, когда переведет разговор на оператора и как обработает запрос.

Плюс есть регуляторные ограничения: клиент должен понимать, что взаимодействует с ИИ, иметь возможность отказаться от такого взаимодействия, а решения системы должны контролироваться и пересматриваться.

У сценарного подхода есть предел. Со временем вариантов диалога становится слишком много, исключения растут быстрее, чем команда успевает их описывать, а поддержка логики превращается в постоянную ручную работу.

При этом бизнесу уже нужен не формальный ответ, а полноценный разговор: проверить платеж, уточнить статус, провести клиента через несколько шагов и сохранить контекст.

Именно здесь появляется роль LLM.

Но здесь важно не перепутать функции. Модель не должна быть источником фактов. Ее задача— понимать речь, удерживать контекст и формулировать ответ в рамках заданной логики.

Сами данные при этом должны приходить из внутренних систем через API.

Когда это разделение соблюдается, система работает стабильно. Когда нет — появляется очень убедительный интерфейс, который может также убедительно и уверенно ошибаться.

Подключение модели напрямую к телефонии или CRM обычно хорошо выглядит только на демо.

В реальной инфраструктуре без маршрутизации, слоя знаний, ограничений и нормального слоя интеграций система становится ненадежной. Она может звучать естественно, но при этом ошибаться в фактах, нарушать бизнес-логику или нарушать закон о персональных данных.

Переход к LLM — это не история про «было просто, стало умно». Это история про появление еще одного слоя в архитектуре.

Модель начинает хорошо работать с языком и контекстом, но ответственность за данные, маршруты, правила и контроль по-прежнему остается на стороне системы.

Чек-лист от технической команды СВОЙ Тех по интеграции LLM ищите в нашем блоге на Хабре.

* LLM (Large Language Model или Большая языковая модель) — это продвинутая нейросеть, обученная на огромных массивах данных для понимания и генерации естественного языка

Сначала архитектура, потом «магия»: наш путь от сценарных голосовых ботов к умным ассистентам

Почему сценарные боты никуда не исчезли

Когда сценарии перестают справляться

Почему «быстро подключить LLM» — это плохая идея

Какой из этого вывод?