Идеальный разговорный продукт: что обеспечивает хороший UX?

Почему дизайн диалога — это сложно, в чём специфика разговорных интерфейсов и какие правила дизайна обязательно нужно знать VUI-специалисту, чтобы добиться крутого пользовательского опыта. Материал по итогам голосового митапа с экспертами из Тинькофф, VK, Just AI, Додо Пиццы и KODE в телеграм-канале Hey Voice!

Идеальный разговорный продукт: что обеспечивает хороший UX?

Что обеспечивает хороший UX

1. Быстрое решение задач пользователя

Голосового помощника не зря прозвали «помощником», потому что в первую очередь он должен помогать людям решать их задачи без дополнительных усилий. Узнать последние новости и прогноз погоды в утреннем шоу, проложить маршрут до новой кофейни или включить плейлист для чтения статей на vc. Всего один запрос — и помощник возьмёт всё в свои руки.

Разговорные интерфейсы решают и более сложные задачи: снимают нагрузку с колл-центров, автоматизируя процессы, помогают государству, медицине, банкам и бизнесу предоставлять быстрый доступ к услугам, учатся разговаривать с человеком на равных.

В идеале помощник должен быстро выполнять задачу пользователя, органично вписываясь в его поведение. Конечно, не всегда это получается мгновенно — иногда нужно перекинуться с ним несколькими фразами, но удачные разговорные решения с точки зрения UX сильно упрощают клиентский путь и ускоряют получение услуг.

Идеальный разговорный продукт: что обеспечивает хороший UX?

Что это значит с точки зрения разработки?

Нужно чётко осознать, в чём ценность конкретного разговорного продукта. Для этого — хорошо исследовать аудиторию: их потребности, кто они и чем живут. Это может быть дорогостояще, но это точно покажет, какие разговорные решения будут приносить пользу и органично вписываться в поведение пользователей, а какие — станут бесполезными.

Для того, чтобы решать проблему пользователя, надо так спроектировать разговорный интерфейс и так выбрать способ закрыть эту «боль», чтобы он был органичным. Даже если мы знаем потребности пользователей, нельзя им навязать какое-то решение. Всё-таки разговорный интерфейс — это относительно новая технология. Вот я сейчас смотрю «Аббатство Даунтон» и вижу, как люди противятся тому, чтобы в их домах ставили электрическую лампочку. Представляю, что некоторые разговорные решения для большинства пользователей так и выглядят — как какое-то новшество, без которого и так хорошо живётся.

Ирина Степанова, Дизайнер-аналитик Just AI

Одним из самых успешных юзкейсов с точки зрения UX можно считать голосовой ввод в телевизоре, который избавил пользователей от неудобного ввода по букве с пульта. Пример неидеального кейса — передача показаний счётчиков. Хотя голосовой навык справляется со своей основной задачей, упрощая клиентский путь, не всем пользователям может быть удобно диктовать данные в тайминг, установленный в сценарии диалога.

В голосе хорошо всё то, что человек и так делает голосом. Особенно если это в разы ускоряет решение его задач.

2. Баланс функциональности и креатива

Голосовых ассистентов часто персонифицируют, наделяют индивидуальными характеристиками и прописывают чёткий тон-оф-войс — то, как помощник будет говорить с человеком. Но яркая личность и креативные ответы — скорее дополнительный функционал, чем базовое решение.

Голосовой помощник или чат-бот должен в первую очередь решать проблемы пользователя. И делать это моментально. Здесь можно пожертвовать креативом — он может быть излишним, когда нужны конкретный ответ или действие здесь и сейчас. А если пользователь настроен просто поболтать, то можно и проявить остроумие, а заодно подчеркнуть характер персонажа.

Арина Лисицына, Редактор ассистента Маруси, VK

Соотношение функциональности и креатива зависит от масштаба и частоты использования голосового помощника. Выполнять короткую и функциональную команду, вроде перевода денег раз в неделю, можно и без персонификации. Но чем чаще пользователь общается с ассистентом, тем важнее становится характер.

Идеальный разговорный продукт: что обеспечивает хороший UX?

Идеальный разговорный продукт — это соотношение функциональности и креатива, которое подходит для решения конкретной бизнес-задачи.

У России есть передовой опыт в создании мультифункциональных и кастомных ассистентов — это Алиса, Маруся, Олег, Сбер. Но не всё, что подходит крупным ассистентам, подходит любым разговорным продуктам. Уровень персонификации зависит от того, какие задачи пользователя она решает и как часто.

Начиная работу над проектированием голосового помощника, важно задавать себе вопрос, зачем вам нужна персонификация. Это решение будет бесповоротным и повлияет на UX очень серьёзным образом. Нужен ли яркий и своенравный характер вашему боту, как у той же Алисы, — это большой вопрос.

Никита Муренький, тимлид в команде голосовых интерфейсов KODE

3. Приятный эмпатичный голос

Особенно это актуально для телефонных ботов, которые обзванивают клиентов. Их главная задача — поговорить с человеком так, чтобы он не бросил раздражённо трубку в первые секунды разговора, а остался на линии и выполнил целевое действие: например, согласился на смс-рассылку.

Идеальный разговорный продукт: что обеспечивает хороший UX?

По исследованиям Amazon, Apple, Microsoft и Google Assistant, пользователям больше нравится женский голос в голосовых ассистентах. Они считают его более «отзывчивым» и лучше воспринимают. Даже банку Тинькофф пришлось пересмотреть своё решение для банковского помощника Олега.

Мы сейчас делаем небольшое исследование про приятный голос. Пока рано говорить о результатах, но, кажется, мы поняли, что мужчинам больше нравятся женские голоса. Части пользователей не нравится Олег — по характеру или сам голос. Такие клиенты с удовольствием соглашаются на Алёну — это второй наш персонаж, который родился в ответ на запрос пользователей.

Мария Лелека, Главный редактор ассистента Олега, Тинькофф

Особенности разговорного интерфейса в отличие от графического

Даже самые современные интерфейсы требуют от нас того, чтобы мы учились взаимодействию с ними. В своё время мы учились кликать на мышку, свайпать, делать зум, а теперь такие же изменения происходят через голосовые интерфейсы. Но особенность их заключается в том, что нам не нужно учиться, потому что взаимодействовать голосом — это естественно.

Паттерны поведения в разговорном интерфейсе базируются не на том, как мы привыкли обращаться с компьютерными системами, а на том, как мы взаимодействуем с людьми.

Для проектирования любых интерфейсов действуют общие правила UX-дизайна, но паттерн поведения пользователей разговорных интерфейсов только формируется. На это влияет несколько вещей:

  • Окружение для интерфейса. В отличие от графического интерфейса, где есть карта сайта или архитектура приложения, которую можно нарисовать в схеме, в разговоре нет никакой иерархии. Именно по причине того, что диалог с ассистентом сильно приближен к разговору между людьми, он тоже может быть нелинейным — и это ключевая сложность при проектировании разговорных интерфейсов.

В графическом интерфейсе всё более линейно, запланировано, чем в голосовом. Если на сайте юзер действует только в рамках тех шагов и вариантов ответа, которые предусмотрел дизайнер, то в диалоге он более свободен: может по-своему формулировать запросы или задавать дополнительные вопросы — и всё это надо распознать, понять, смэтчить в правильный скилл.

Арина Лисицына, Редактор ассистента Маруси, VK

Искусственные ограничения диалога тоже создаются — в конкретных навыках в экосистемах или утилитарных помощниках. Тогда пользователь должен подстроиться под выстроенную иерархию диалога — иначе у него не получится решить задачу. Например, сюда относятся банковские переводы или заказ пиццы.

  • Ограничение каналов взаимодействия. В телефонных каналах или экосистемах это ограничения самих платформ, а в банковском помощнике Олеге, например, — ограничение функционала в зависимости от способа взаимодействия.

У нас есть и чат-бот и голосовой робот в колл-центре. Голосового робота намного сложнее делать с точки зрения интерфейса, потому что там нет никаких визуальных элементов. В чате можно направить пользователя, показать виджет, подсказки и тем самым увести волну его интереса, куда нам или ему надо. В голосе этого нет, лучше работают закрытые вопросы и короткие фразы, нет инструментов контроля поведения пользователя. Голосовое меню мы не используем, потому что оно всех, включая нас, бесит.

Мария Лелека, Главный редактор ассистента Олега, Тинькофф

Голос — это однопоточный канал, поэтому на диалог должен быть направлен весь фокус внимания. Если во время общения с чат-ботом пользователь может заблокировать телефон и вернуться к нему через 5–10 минут, то в голосе важна скорость взаимодействия и, как следствие, объём информации, которую выдаёт помощник. Если в графическом интерфейсе можно показать один виджет, где будут сразу все данные, которые нужно согласовать с пользователем, то в голосе каждый шаг нужно уточнять по отдельности.

Люди уже привыкли к графическим интерфейсам: они понимают, что «крестик» — это закрыть, «стрелочка» — вперёд. В голосе этого нет, и как только что-то идёт не так — зовут оператора. Диалог строится по аналогии с человеческим диалогом, голосовые сценарии очень далеки от визуальных интерфейсов.

Мария Лелека, Главный редактор ассистента Олега, Тинькофф

Принципы графического и UX-дизайна, которые важны в разговорных продуктах

Для голосового интерфейса можно переиспользовать множество UX-практик: то, что уже использовалось на протяжении многих лет, или то, что сейчас в тренде. Вот основные принципы, которые можно транслировать на голосового ассистента, где бы он ни находился — в мобильном приложении или на любом другом устройстве.

1. Дискаверабилити. Способность легко находить функционал и управлять им. Часто пользователи не понимают, на что способен ассистент и какие задачи умеет решать. Например, вы знали, что помощник Google умеет подбрасывать кубик?

Мне импонирует идея с подсказками — чипсами, баблами, кнопками, если это мультимодальный интерфейс. Многое подсказывает ассистент, но создание уместных и естественных подсказок о возможностях бота — это всё равно вызов для дизайнеров разговорных интерфейсов. И это нужно как-то решать, потому что каталоги экосистем активно пополняются. Идеальный конечный результат — настолько изучить потребности пользователя, чтобы можно было отвечать на любой его запрос и подсказывать об имеющихся возможностях из каталога навыков.

Ирина Степанова, Дизайнер-аналитик Just AI

Мы стараемся не ограничивать пользователя в количестве сценариев. Мы говорим: вы спросите, если я умею — я вам помогу. Если не умею, то скажу об этом и переведу на оператора, если он нужен. Мы бы хотели, чтобы Олег представлялся не как робот, а как человек, с которым можно поговорить и который будет давать осмысленные ответы, то есть не ограничивать пользователя, а давать ему возможность спросить все, что хочется. Мы собираем такой фидбэк, и на основе этого создаём уже новые навыки.

Мария Лелека, Главный редактор ассистента Олега, Тинькофф

2. Гиперперсонализация. Когда система умеет распознавать пользователя (например, через сохранённые ключи) и сразу предлагать те сценарии, которые ему нужны. Это в разы ускоряет решение задач пользователя.

Идеальный разговорный продукт: что обеспечивает хороший UX?

3. Отклик и понятное состояние системы. Важно, чтобы пользователь понимал, в каком состоянии находится голосовой ассистент: слушает он или нет, что-то загружает или произошла какая-то ошибка. Весь дизайн должен доносить до пользователя эти сведения: с помощью графики, саунд-дизайна и речи.

4. Консистентность всего продукта. Особенно важно для экосистем, где сторонние разработчики могут создавать свои навыки. Конечно, странно ожидать, что все внутренние продукты будут едиными, как и мобильные приложения внутри App Store или Google Play не будут похожи между собой. Тем не менее для пользователей интерфейс должен быть предсказуем.

Консистентность очень важна, но мы стараемся не ограничивать разработчиков, которые создают навыки для Маруси. Однако если в них присутствуют какие-то персонажи со своими голосами и со своей харизмой, мы стараемся их представлять. То есть Маруся сначала представляет, что эту игру будет вести, например, Совёнок, и только потом запускается навык. Сложности восприятия сразу исчезают.

Арина Лисицына, Редактор ассистента Маруси, VK

В экосистемах также существуют отраслевые стандарты и унификации, которым разработчики обязательно должны следовать. Например, во всех крупных голосовых ассистентах в России нельзя зарелизить навык, если там нет интента помощи. Надеемся, скоро этот список пополнится и другими интентами (например, «повтори»), а также будет обязательной практика шортката, когда пользователь за один шаг может пройти сразу несколько этапов диалога.

5. Отмена действия. У пользователя всегда должна быть возможность безболезненно отменить своё действие — без повтора диалога и экстренных действий. Например, словами «назад», «отменить» или «начать сначала».

3 совета начинающим разговорным дизайнерам, которые хотят сделать свой продукт лучше

1. Моделируйте и исследуйте поведение пользователя. Когда придумываете навык, всегда чётко отвечайте себе на вопрос, зачем вы это делаете и какую задачу пользователя решаете. Учитывайте разные варианты сценариев и интенты, чтобы сделать скилл удобным — например, заранее моделируя поведение человека через практику Wizard of Oz. Не забывайте следить за фидбэком и аналитикой, чтобы улучшать эти сценарии.

2. Разбирайте от и до чужие навыки. На начальном этапе это очень поможет прокачать свой уровень, потому что вы начнёте досконально разбираться в том, по каким принципам создаются навыки.

3. Учитесь у больших команд, а потом делайте свои маленькие продукты. Проходить этот путь самим довольно сложно — сначала приходите к тем, кто уже умеет проектировать разговорные интерфейсы и набирайтесь опыта.

Ещё больше тезисов и советов — в полной версии голосового митапа по ссылке. Подписывайся на телеграм-канал — перенимай опыт нашей команды голосовых интерфейсов KODE, следи за новостями voice tech и будь на волне трендов.

Актуальные новости и исследования из мира voice tech и conversational AI в одном канале.

1111
6 комментариев

Сам редко пользую голосовой помощник, но по моему не мало ниш где без него никак:
- пожилые люди
- управление "умными устройствами" в бытовой деятельности ( уборка, готовка)
- взаимодействие с "умными устройствами", на спорте
и т.п.

1
Ответить
Автор

Да, верно, голос органически встроился во многие сферы нашей жизни. Особенно впечатляет, как американские коллеги внедряют его в дома престарелых или больницы, чтобы пожилые люди могли оперативно вызвать помощь, если им потребуется.

1
Ответить

Голосовой интерфейс обязан умереть

Ответить
Автор

Хорошая провокация, чтобы зайти в ваш профиль и узнать о Маше ;)

Ответить