{"id":14274,"url":"\/distributions\/14274\/click?bit=1&hash=fadd1ae2f2e07e0dfe00a9cff0f1f56eecf48fb8ab0df0b0bfa4004b70b3f9e6","title":"\u0427\u0435\u043c \u043c\u0443\u0440\u0430\u0432\u044c\u0438\u043d\u044b\u0435 \u0434\u043e\u0440\u043e\u0436\u043a\u0438 \u043f\u043e\u043c\u043e\u0433\u0430\u044e\u0442 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u0438\u0441\u0442\u0430\u043c?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"6fbf3884-3bcf-55d2-978b-295966d75ee2"}

Голосовые помощники говорят голосами живых и мёртвых, учатся понимать нормальную речь и защищают россиян от спама

Летний дайджест главных новостей из мира голоса и разговорных технологий. Подготовлен командой разговорных продуктов KODE.

С голосовыми помощниками можно говорить как с обычными людьми

Ассистенты Салют Сбера научились понимать мультикоманды. Это значит, что для Сбера, Джоя и Афины больше не нужно искусственно дробить фразы, достаточно сказать: «Салют, приглуши свет и включи телевизор!». Ассистент выполнит обе просьбы.

Сбер заявляет, что другие голосовые помощники так не умеют. Сейчас на российском рынке это действительно так.

При этом Алекса, ассистент Гугл и Сири с подобными задачами справляются. Например, можно сказать «Hey Google, turn up the volume and play music». Амазон ещё в 2018 году добавил в настройки Алексы follow up mode, который позволяет продолжать давать команды без повторения имени помощника.

Алекса научилась говорить как королева и голосами людей, которых уже нет с нами

Голосовой помощник от Амазон уже давно использует разные голоса. В Канаде она принимала заказы на доставку из KFC голосом полковника Сандерса, а летом 2022 года, к юбилею Елизаветы II на престоле, заговорила голосом британской королевы. Алекса стала петь национальный гимн и отвечать пользователю на вопрос, знает ли он Елизавету лично.

К празднику у Алексы появилось два новых навыка: «Чаепитие» и «Насколько я королевский». / Источник: Амазон

В Амазон научили Алексу говорить не только голосами живых людей. Чтобы сымитировать голос уже умершего человека, ей достаточно послушать всего минуту записи. Эту технологию анонсировали на конференции re:Mars, но подробностей пока не раскрыли.

В компании говорят, что голосовой помощник, конечно, не может облегчить боль утраты, но поможет продлить воспоминания. Обсудить этическую сторону такой работы голосового помощника предлагаем в комментариях.

В Японии не стали заходить так далеко и научили игрушку читать сказки голосами родителей

Производитель Takara Tomy представил Coemo — умную колонку с ИИ. Искусственный интеллект синтезирует голос человека и воспроизводит его, рассказывая истории.

Записать образец голоса можно с помощью приложения. Полученное аудио ИИ использует, чтобы создать голосовой профиль родителя. В Coemo предварительно загружено 60 сказок, в том числе японские народные и сказки братьев Гримм. Когда ребёнок захочет их послушать, он услышит голос мамы или папы.

Производитель Coemo использует ту же технологию, с помощью которой создают дипфейки. / Источник: Takara Tomy

В Нью-Йорке скрашивать будни пенсионеров будут роботы-компаньоны

Устройства должны развлекать одиноких людей разговорами и следить, чтобы они вовремя принимали лекарства.

Робота ElliQ разработала израильская компания Intuition Robotics. Он состоит из двух частей. «Лицо» с микрофоном и динамиками поворачивается к человеку и подсвечивается. На планшете ElliQ показывает картинки, информацию из приложений и собеседника во время видеозвонка.

ElliQ умеет проявлять эмпатию и подстраиваться под характер пользователя: например, много шутить, если хозяин любит посмеяться. / Источник: The Verge

Виртуальные секретари защитят россиян от спама

Абоненты Билайна могут выбрать себе одного из пяти помощников: Дарью, Сергея, Скай, Нику и Кроша из «Смешариков».

Основные функции у всех одинаковы:

▪защита от спама,

▪ответы на звонки,

▪запись звонков и расшифровка.

Помощник работает в связке с телеграм-ботом. С его помощью можно выбрать или сменить персонажа.

От виртуальных секретарей — к виртуальным людям

Виртуальные люди — это логичное развитие голосовых помощников и чат-ботов. Такое мнение высказал в интервью Джо Мёрфи (DeepBrainAI, США). Он сравнивает будущую эволюцию чат-ботов и помощников с другими технологиями, которые развились благодаря добавлению формата видео: радио → ТВ, телефонный звонок → звонок FaceTime.

Виртуальные люди могут «работать» продавцами, рассказывая подробнее о товарах и ценах, или ведущими на телевидении, освещая последние новости. Корейский KB Bank установил информационные киоски с «цифровыми двойниками» в своих отделениях по всей стране. Технологии проникли даже в политику: президент Южной Кореи Юн Сок Ёль использовал «цифрового двойника» для общения с молодыми избирателями.

Тренды в использовании голосовых помощников

В США, Великобритании и Германии Алекса обогнала по популярности ассистента Гугл и Сири. Это данные нового рейтинга Voice Consumer Index 2022.

Генеральный директор компании Vixen Labs, которая проводила исследование, считает, что в использовании голосовых помощников наступил переломный момент: из новинки они превратились в удобный инструмент. Второй тренд, который показало исследование, — люди стали чаще обращаться к голосовым ассистентам. 38% людей в США и Великобритании задают вопросы помощнику хотя бы раз в день (в прошлом году таких было на 13% меньше), в Германии — 32% (здесь рост на 1%).

Такая же тенденция есть и в России — продажи умных колонок в первом полугодии 2022 выросли более чем на 70%.

Топ-5 умных колонок в России сейчас выглядит так:

1. «Станция лайт» с Алисой

2. VK Капсула с Марусей

3. Xiaomi с Марусей

4. JBL с Алисой

5. Устройство Сбера с ассистентом Салют.

Конференция SpeechKit Cases Night в Яндексе

О том, как бизнес использует речевые технологии, говорили на конференции в Яндексе. Лид команды разговорных продуктов KODE Никита Муренький поучаствовал в обсуждении и привёз самые интересные инсайты.

British American Tobacco внедрили аудиобейджи, чтобы улучшить обслуживание клиентов

Аудиобейдж — это девайс с экраном, на котором выводится имя, и микрофоном для записи разговоров. British American Tobacco использовали бейджи компании VocaTech, чтобы анализировать разговоры сотрудников с потребителями. На основе этой информации компания проверяет, следуют ли сотрудники скриптам, и анализирует эффективность самих скриптов.

Голосовой помощник на треть снизил затраты на колл-центр

Сервис доставки «Достависта» использует голосового ассистента для обучения сотрудников. Ассистент Ника звонит курьерам, чтобы научить их работать с заказами или провести инструктаж по расчётно-кассовому обслуживанию. Процент дозвона Ники сопоставим с операторским — 50–60% против 70%. Когда «Достависта» внедрила голосового помощника, затраты на колл-центр снизились на 30%.

Конверсия повышается в разы, если робот заставляет клиентов улыбнуться хотя бы раз в течение разговора

Робот помог Unisender охватить рынок российских компаний, которые пользуются зарубежными сервисами email-рассылок. Результат — конверсия 4,63%, а стоимость одного лида — 107 ₽. Это значительно дешевле, чем в других каналах.

Публикации в медиа

Когда мы создаём сложные разговорные продукты с нуля, то в первую очередь решаем, какие сценарии прорабатывать, а какие можно отложить. Для этого есть один лайфхак. Лид команды разговорных продуктов KODE поделился им в статье на Хабре.

Это седьмой дайджест команды разговорных продуктов KODE. О весенних событиях в индустрии голоса читайте по ссылке.

Телеграм-канал Hey Voice!
Новости и исследования из мира голосовых технологий и разговорного ИИ
0
1 комментарий
Михаил Седов

Выдумываем себе странный мир, а теперь еще просим компьютеры выдумывать его для нас. Так и живем все в одной большой выдумке

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда