Голосовые помощники говорят голосами живых и мёртвых, учатся понимать нормальную речь и защищают россиян от спама
Летний дайджест главных новостей из мира голоса и разговорных технологий. Подготовлен командой разговорных продуктов KODE.
С голосовыми помощниками можно говорить как с обычными людьми
Ассистенты Салют Сбера научились понимать мультикоманды. Это значит, что для Сбера, Джоя и Афины больше не нужно искусственно дробить фразы, достаточно сказать: «Салют, приглуши свет и включи телевизор!». Ассистент выполнит обе просьбы.
Сбер заявляет, что другие голосовые помощники так не умеют. Сейчас на российском рынке это действительно так.
При этом Алекса, ассистент Гугл и Сири с подобными задачами справляются. Например, можно сказать «Hey Google, turn up the volume and play music». Амазон ещё в 2018 году добавил в настройки Алексы follow up mode, который позволяет продолжать давать команды без повторения имени помощника.
Алекса научилась говорить как королева и голосами людей, которых уже нет с нами
Голосовой помощник от Амазон уже давно использует разные голоса. В Канаде она принимала заказы на доставку из KFC голосом полковника Сандерса, а летом 2022 года, к юбилею Елизаветы II на престоле, заговорила голосом британской королевы. Алекса стала петь национальный гимн и отвечать пользователю на вопрос, знает ли он Елизавету лично.
В Амазон научили Алексу говорить не только голосами живых людей. Чтобы сымитировать голос уже умершего человека, ей достаточно послушать всего минуту записи. Эту технологию анонсировали на конференции re:Mars, но подробностей пока не раскрыли.
В компании говорят, что голосовой помощник, конечно, не может облегчить боль утраты, но поможет продлить воспоминания. Обсудить этическую сторону такой работы голосового помощника предлагаем в комментариях.
В Японии не стали заходить так далеко и научили игрушку читать сказки голосами родителей
Производитель Takara Tomy представил Coemo — умную колонку с ИИ. Искусственный интеллект синтезирует голос человека и воспроизводит его, рассказывая истории.
Записать образец голоса можно с помощью приложения. Полученное аудио ИИ использует, чтобы создать голосовой профиль родителя. В Coemo предварительно загружено 60 сказок, в том числе японские народные и сказки братьев Гримм. Когда ребёнок захочет их послушать, он услышит голос мамы или папы.
В Нью-Йорке скрашивать будни пенсионеров будут роботы-компаньоны
Устройства должны развлекать одиноких людей разговорами и следить, чтобы они вовремя принимали лекарства.
Робота ElliQ разработала израильская компания Intuition Robotics. Он состоит из двух частей. «Лицо» с микрофоном и динамиками поворачивается к человеку и подсвечивается. На планшете ElliQ показывает картинки, информацию из приложений и собеседника во время видеозвонка.
Виртуальные секретари защитят россиян от спама
Абоненты Билайна могут выбрать себе одного из пяти помощников: Дарью, Сергея, Скай, Нику и Кроша из «Смешариков».
Основные функции у всех одинаковы:
▪защита от спама,
▪ответы на звонки,
▪запись звонков и расшифровка.
Помощник работает в связке с телеграм-ботом. С его помощью можно выбрать или сменить персонажа.
От виртуальных секретарей — к виртуальным людям
Виртуальные люди — это логичное развитие голосовых помощников и чат-ботов. Такое мнение высказал в интервью Джо Мёрфи (DeepBrainAI, США). Он сравнивает будущую эволюцию чат-ботов и помощников с другими технологиями, которые развились благодаря добавлению формата видео: радио → ТВ, телефонный звонок → звонок FaceTime.
Виртуальные люди могут «работать» продавцами, рассказывая подробнее о товарах и ценах, или ведущими на телевидении, освещая последние новости. Корейский KB Bank установил информационные киоски с «цифровыми двойниками» в своих отделениях по всей стране. Технологии проникли даже в политику: президент Южной Кореи Юн Сок Ёль использовал «цифрового двойника» для общения с молодыми избирателями.
Тренды в использовании голосовых помощников
В США, Великобритании и Германии Алекса обогнала по популярности ассистента Гугл и Сири. Это данные нового рейтинга Voice Consumer Index 2022.
Генеральный директор компании Vixen Labs, которая проводила исследование, считает, что в использовании голосовых помощников наступил переломный момент: из новинки они превратились в удобный инструмент. Второй тренд, который показало исследование, — люди стали чаще обращаться к голосовым ассистентам. 38% людей в США и Великобритании задают вопросы помощнику хотя бы раз в день (в прошлом году таких было на 13% меньше), в Германии — 32% (здесь рост на 1%).
Такая же тенденция есть и в России — продажи умных колонок в первом полугодии 2022 выросли более чем на 70%.
Топ-5 умных колонок в России сейчас выглядит так:
1. «Станция лайт» с Алисой
2. VK Капсула с Марусей
3. Xiaomi с Марусей
4. JBL с Алисой
5. Устройство Сбера с ассистентом Салют.
Конференция SpeechKit Cases Night в Яндексе
О том, как бизнес использует речевые технологии, говорили на конференции в Яндексе. Лид команды разговорных продуктов KODE Никита Муренький поучаствовал в обсуждении и привёз самые интересные инсайты.
British American Tobacco внедрили аудиобейджи, чтобы улучшить обслуживание клиентов
Аудиобейдж — это девайс с экраном, на котором выводится имя, и микрофоном для записи разговоров. British American Tobacco использовали бейджи компании VocaTech, чтобы анализировать разговоры сотрудников с потребителями. На основе этой информации компания проверяет, следуют ли сотрудники скриптам, и анализирует эффективность самих скриптов.
Голосовой помощник на треть снизил затраты на колл-центр
Сервис доставки «Достависта» использует голосового ассистента для обучения сотрудников. Ассистент Ника звонит курьерам, чтобы научить их работать с заказами или провести инструктаж по расчётно-кассовому обслуживанию. Процент дозвона Ники сопоставим с операторским — 50–60% против 70%. Когда «Достависта» внедрила голосового помощника, затраты на колл-центр снизились на 30%.
Конверсия повышается в разы, если робот заставляет клиентов улыбнуться хотя бы раз в течение разговора
Робот помог Unisender охватить рынок российских компаний, которые пользуются зарубежными сервисами email-рассылок. Результат — конверсия 4,63%, а стоимость одного лида — 107 ₽. Это значительно дешевле, чем в других каналах.
Публикации в медиа
Когда мы создаём сложные разговорные продукты с нуля, то в первую очередь решаем, какие сценарии прорабатывать, а какие можно отложить. Для этого есть один лайфхак. Лид команды разговорных продуктов KODE поделился им в статье на Хабре.
Это седьмой дайджест команды разговорных продуктов KODE. О весенних событиях в индустрии голоса читайте по ссылке.
Выдумываем себе странный мир, а теперь еще просим компьютеры выдумывать его для нас. Так и живем все в одной большой выдумке