Современные тренды ИИ-ассистентов и перспективы их развития

5 примеров платформ для разных задач

Платформы для создания ассистентов с искусственным интеллектом – это стремительно развивающаяся фундаментальная технология, позволяющая запускать диалоговые системы для коммуникации с пользователями.

На сегодняшний день единого подхода к разработке ИИ-ассистентов не существует, а на рынке присутствуют как проекты Big Tech корпораций с ориентацией на собственные инструменты с закрытым кодом, так и небольшие проекты с большей свободой разработки и стремлением к low-code/no-code возможностям.

ИИ-ассистенты, начавшиеся с автоматизированных ответов на часто задаваемые вопросы и на данный момент находящиеся на стадии разработки доменно-специфичных решений на основе намерений, в дальнейшем будущем будут развиваться в мультимодальные end-to-end решения, поддерживающие много доменов и глубокий контекст. В этой статье рассмотрим пять известных платформ и их возможности.

В сухом остатке получается, что на данный момент платные сервисы преимущественно имеют закрытый исходный код и используются для создания простых, задаче-ориентированных помощников для бизнеса. Для снижения порога входа предоставляются визуальные интерфейсы создания сценариев, однако такие интерфейсы ограничивают гибкость системы до использования регулярных выражений, намерений и сущностей в качестве единственных способов понимания языка, и шаблонов с заполнением слотов в качестве ответов. Тенденция на предоставление большей гибкости, пусть и с необходимостью писать код, позволит расширить возможности многонавыковых ИИ-ассистентов уже в ближайшем будущем.

Современные тренды ИИ-ассистентов и перспективы их развития

Этот ассистент развивается благодаря коммьюнити энтузиастов, имеет открытый код и может быть установлен на любое устройство. Он ориентирован на приватность и полностью кастомизируется. Mycroft отвечает на общетематические фактологические вопросы, выполняет задачи помощника, проигрывает мультимедиа, а также имеет как набор готовых навыков, так и позволяет подключить кастомные навыки на основе намерений.

Genie начинался как исследовательский некоммерческий проект, поэтому он обладает всеми качествами хорошего ИИ-ассистента: он ориентирован на приватность, имеет открытый код и может подключаться ко всем типам девайсов. В Genie имеется собственная база применения IoT девайсов, а взаимодействие строится на основе определения намерений пользователя. В этого ассистента встроена вопросно-ответная система, а также «болталка» на основе Chirpy Cardinal. Единственный минус – у Genie нет визуального интерфейса разработки.

Следующая платформа – это линейка интегрированных между собой продуктов Microsoft с закрытым кодом и платным доступом. Они предназначены для бизнес-аналитики и автоматизации бизнес-процессов, а также написания приложений на low-code языке либо с использованием готовых шаблонов. Для создания сценарных чат-ботов разработана платформа Power Virtual Agents, которая представляет собой деплой на сервисах Microsoft и имеет пусть и не самый гибкий, но доступный визуальный интерфейс для создания сценариев и встроенную аналитику диалогов.

Эта low-code платформа ориентирована на построение простых ИИ-ассистентов и содержит обучаемую на малом числе примеров систему понимания естественного языка, основной фокус которой сделан на классификации намерений и извлечении сущностей. Она имеет открытый код, визуальный интерфейс и позволяет добавлять кастомные компоненты.

Для создания сценарного навыка разработчик задает намерения и примеры для них с возможностью извлечения сущностей. Для каждого намерения загружается набор возможных ответов, слоты в которых также могут заполняться извлеченными из реплики человека сущностями. Можно создавать правила перехода в сценариях и обучать диалоговый менеджмент на основе примеров ожидаемых диалогов с разрабатываемой системой.

Данная платформа предназначена для разработки кастомизируемых многонавыковых ИИ-ассистентов, имеющих микросервисную архитектуру и оркестрируемых с помощью DeepPavlov Agent. Имеет открытый код, визуальный интерфейс для создания сценарных навыков, встроенную «болталку», возможность локального развертывания на любых системах и интеграции любых сервисов.

Основной бот DeepPavlov Dream – диалоговая система на английском языке, имеющая в своей библиотеке большой набор ранжирующих, генеративных и сценарных скиллов. Для того, чтобы ответить пользователю наилучшим образом, система должна на каждом этапе диалога сначала выбрать скиллы, формирующие ответы, а затем – наилучшую гипотезу из всех возможных с учетом уже накопленных знаний о диалоге.

В 2022-2023 на платформу будут добавлены инструменты для визуального создания многонавыковых ИИ-ассистентов из имеющихся компонент для уменьшения порога входа, инструменты аналитики диалогов и русский язык.

В сухом остатке получается, что на данный момент платные сервисы преимущественно имеют закрытый исходный код и используются для создания простых, задаче-ориентированных помощников для бизнеса. Для снижения порога входа предоставляются визуальные интерфейсы создания сценариев, однако такие интерфейсы ограничивают гибкость системы до использования регулярных выражений, намерений и сущностей в качестве единственных способов понимания языка, и шаблонов с заполнением слотов в качестве ответов. Тенденция на предоставление большей гибкости, пусть и с необходимостью писать код, позволит расширить возможности многонавыковых ИИ-ассистентов уже в ближайшем будущем.

44
Начать дискуссию