Сначала архитектура, потом «магия»: наш путь от сценарных голосовых ботов к умным ассистентам
Вокруг голосового ИИ до сих пор существует слишком красивая картинка: подключили LLM* и получили почти «живого» ассистента. На практике в финтехе всё работает гораздо приземленнее.
Переход к умным голосовым агентам — это не просто замена старой системы новой. Это постепенное усложнение архитектуры.
Почему сценарные боты никуда не исчезли
Любой голосовой бот сначала строится на очень понятной базе: сценарии, интенты, ключевые слова, маршруты диалога. Дальше команда долго донастраивает систему: смотрит отчеты, корректирует ответы, проверяет логику переходов.
Потом появляются интеграции через API, аналитика, маршрутизация звонков, работа с внутренними сервисами. И только после этого в систему начинают добавлять LLM.
Важно, что модель появляется не вместо архитектуры, а поверх неё.
При этом сценарные боты до сих пор остаются важной частью системы. Особенно в финтехе, где критична предсказуемость: нужно понимать, что именно агент скажет клиенту, когда переведет разговор на оператора и как обработает запрос.
Плюс есть регуляторные ограничения: клиент должен понимать, что взаимодействует с ИИ, иметь возможность отказаться от такого взаимодействия, а решения системы должны контролироваться и пересматриваться.
Когда сценарии перестают справляться
У сценарного подхода есть предел. Со временем вариантов диалога становится слишком много, исключения растут быстрее, чем команда успевает их описывать, а поддержка логики превращается в постоянную ручную работу.
При этом бизнесу уже нужен не формальный ответ, а полноценный разговор: проверить платеж, уточнить статус, провести клиента через несколько шагов и сохранить контекст.
Именно здесь появляется роль LLM.
Но здесь важно не перепутать функции. Модель не должна быть источником фактов. Ее задача— понимать речь, удерживать контекст и формулировать ответ в рамках заданной логики.
Сами данные при этом должны приходить из внутренних систем через API.
Когда это разделение соблюдается, система работает стабильно. Когда нет — появляется очень убедительный интерфейс, который может также убедительно и уверенно ошибаться.
Почему «быстро подключить LLM» — это плохая идея
Подключение модели напрямую к телефонии или CRM обычно хорошо выглядит только на демо.
В реальной инфраструктуре без маршрутизации, слоя знаний, ограничений и нормального слоя интеграций система становится ненадежной. Она может звучать естественно, но при этом ошибаться в фактах, нарушать бизнес-логику или нарушать закон о персональных данных.
Какой из этого вывод?
Переход к LLM — это не история про «было просто, стало умно». Это история про появление еще одного слоя в архитектуре.
Модель начинает хорошо работать с языком и контекстом, но ответственность за данные, маршруты, правила и контроль по-прежнему остается на стороне системы.
Чек-лист от технической команды СВОЙ Тех по интеграции LLM ищите в нашем блоге на Хабре.
* LLM (Large Language Model или Большая языковая модель) — это продвинутая нейросеть, обученная на огромных массивах данных для понимания и генерации естественного языка