Эволюция голосовых помощников – из смартфонов в космос

О них сегодня многие говорят, чуть меньше — их используют и совсем мало кто точно знает, что они из себя представляют. Product owner Calltouch Ксюша Федоринина рассказала о том, как изменилась сфера применения голосовых помощников.

Эволюция голосовых помощников – из смартфонов в космос

Современные технологии делают нашу жизнь проще. Ещё в начале 2000-х мы пользовались кнопочными мобильными телефонами, в интернет выходили только с компьютеров и даже не мечтали о том, чтобы заказывать такси или доставку еды в офис буквально в один клик. За прошедшие 20 лет смартфон стал универсальным инструментом для решения многих задач, и то, что раньше было недоступно, сегодня никого не удивляет.

Аналогичная ситуация и с голосовыми помощниками. Могли ли мы представить ещё десять лет назад, что по голосовой команде можно будет включить либо погасить свет в комнате или построить оптимальный маршрут до работы? А сегодня, например, по данным Pew Research Center, различные голосовые помощники использует практически каждый второй американец (46%), а аналитики Juniper прогнозируют увеличение числа устройств, оснащённых этой технологией, в США до 870 млн к 2022 году. Россияне тоже голосуют за: согласно результатам исследования Mail.ru Group, 78% наших соотечественников считают, что в будущем голосовые помощники станут неотъемлемой частью жизни.

Имена Siri и Алиса сегодня у всех на слуху, технология постоянно совершенствуется и охватывает всё новые сферы, и мы как компания, работающая на IT-рынке, решили проследить историю развития голосовых помощников.

Что под капотом у голосовых помощников

Эволюция голосовых помощников – из смартфонов в космос

Голосовые помощники работают на базе технологии синтеза и распознавания речи, а под капотом у них движок, состоящий из нейросети, который обучают различным сценариям диалога, или платформа с набором правил.

Стоимость разработки голосового помощника зависит от его функциональности. Базовый набор, позволяющий решению озвучивать справочную информацию и решать заданные задачи, обойдётся компании в несколько миллионов рублей. Разработка более умных решений потребует более значительных затрат.

Голосовые помощники для решения бытовых задач

Первым популярным голосовым помощником стала упомянутая уже Siri от Apple, появившаяся на iPhone 4S, выпущенном на рынок в октябре 2011 года. Чуть позже, в мае 2012 года, другой интернет-гигант — Google — представил свой голосовой помощник Google Assistant. Решения обладают примерно одинаковым функционалом — умеют отправлять сообщения и совершать звонки, создавать записи в календаре, показывать погоду, открывать приложения, включать музыку, отвечать на вопросы и многое другое. И всё это – по голосовой команде владельца смартфона. Чтобы озадачить Siri или Google Assistance, достаточно произнести “Hey Siri” или “OK Google”.

Есть и другие примеры: Microsoft разработал голосовой помощник Cortana, Samsung – Bixby.

Но на самом деле, запустив Siri, Apple не открыла Америку: история голосовых помощников началась задолго до 2011 года. Уже в 1962 году IBM представила решение Shoebox, которое умело распознавать 16 слов и десять цифр (от 0 до 9). А решение Harpy, созданное учёными университета Карнеги – Меллон в 1970-х, распознавало уже 1011 слов, что соответствует словарному запасу трёхлетнего ребёнка. В 1993 году Apple выпустила Macintosh с технологией PlainTalk, а в апреле 1997 года Dragon представила решение, позволяющее превращать в текст до 100 слов в минуту.

Пока пользователи смартфонов с упоением общались с Siri, Google Assistant и другими голосовыми помощниками, компании разрабатывали подобные решения для умного дома.

В ноябре 2014 года Amazon представила смарт-динамик Alexa. Через два года, в ноябре 2016-го, подтянулась Google с Google Home, а в феврале 2018 года на этот рынок вошла и Apple, представив Apple HomPod.

Смарт-динамики могут отвечать на вопросы, включать музыку, совершать звонки, читать новости и так далее. Отдать поручение им тоже можно одним-двумя словами (в зависимости от бренда): “Alexa”, “Hey Google” или “Hey Siri”.

Подобные устройства сегодня можно увидеть и в отелях. Там смарт-динамики позволяют управлять освещением в номере, а также делать в номер заказы.

А что в России?

Эволюция голосовых помощников – из смартфонов в космос

На нашем рынке голосовых помощников безусловное лидерство принадлежит Алисе от Яндекса. Он был запущен в октябре 2017 года и сегодня не только интегрирован в сервисы компании, но и используется в устройствах других производителей: смарт-колонках, умных часах, наушниках.

Но велика вероятность того, что в ближайшее время у Алисы появятся конкуренты: о разработке собственных голосовых помощников заявляли Mail.ru Group, «Тинькофф Банк» и «Центр речевых технологий» (ЦРТ). И это не может не радовать, ведь наличие конкуренции всегда на руку конечным пользователям.

Mail.ru Group уже представила голосовой помощник Маруся на встрече с премьер-министром Дмитрием Медведевым, отметив, что он будет помогать пользователям в повседневной жизни: узнавать расписание транспорта, афишу кинотеатров, результаты спортивных состязаний, искать рецепты блюд и так далее.

«Тинькофф Банк» решил выделиться на фоне конкурентов — его голосовой помощник носит мужское имя Олег. Среди его функций — осуществление денежных переводов, заказ билетов в театр и кино, бронирование столиков в ресторанах.

Не отстаёт и государственный сектор: недавно стало известно, что портал «Госуслуги Бизнес» для малых и средних предпринимателей в скором времени обзаведётся своим голосовым помощником, который сможет удовлетворить практически все потребности пользователей в сфере получения госуслуг: от отслеживания статусов поданных заявок до онлайн-общения с представителями государственных органов. Имени у решения пока нет, но надежды на него возложены немалые.

Голосовые помощники для решения задач бизнеса

Компании сегодня только «пробуют на вкус» новую технологии — бизнес использует голосовые помощники не так активно, как частные пользователи. Однако постепенно они внедряются во всё новых компаниях, пусть распространение идёт и не так быстро, как хотелось бы.

Например, голосовые помощники очень полезны во время коллективных обсуждений. Участникам не нужно отвлекаться на то, чтобы найти необходимые данные или позвонить коллеге, — это можно поручить голосовому помощнику. Также он может делать заметки и записывать все разговоры, переводя их в текст. Всё это позволяет сотрудникам сосредоточиться на теме собрания, не отвлекаясь на подобные моменты.

Кроме того, такие решения незаменимы для обеспечения высокого уровня клиентского сервиса, а это сегодня must-have для любого бизнеса. И мы в Calltouch постоянно совершенствуем это направление.

Недавно в продукте Calltouch Предикт мы реализовали такую фичу, как перевод разговоров в текст. Это открыло перед нашими партнёрами новые возможности. Например, можно быстро проанализировать запросы клиентов, работая над запуском нового продукта, или (не менее быстро) оценить эффективность сотрудников колл-центра, узнав, доносят ли они до клиентов необходимую информацию. Дополнительный бонус: звонки от мужчин и от женщин в тексте подсвечиваются разными цветами, так что на то, чтобы понять, кто чаще звонит в компанию, потребуется буквально несколько секунд. Отталкиваясь от этой информации, можно корректировать объявления и настраивать параметры таргетированной рекламы и в конечном итоге более эффективно распределять рекламный бюджет. Подробнее об этом мы рассказывали здесь.

Эволюция голосовых помощников – из смартфонов в космос

На повышение клиентского сервиса работает и другая наша фича — синтез речи в виджете обратного звонка. Если эта опция включена, оператору колл-центра будет предложено предварительно прослушать голосовое сообщение о параметрах обращения: с какого сайта, какого виджета и в какое время оно было сделано и т. д. Это позволит персонализировать подход к клиенту и избавить его от необходимости отвечать на ряд вопросов, обычных в таких случаях, а также оперативно предоставить интересующую информацию без переключения с одного оператора на другого.

Будущее голосовых помощников

Технологии развиваются очень быстрыми темпами и становятся всё умнее, поэтому, опираясь на прогнозы аналитиков, можно с уверенностью сказать, что со временем проникновение голосовых помощников будет только повышаться. Люди быстро привыкают к вещам, которые предоставляют им принципиально новый уровень комфорта и удобства и открывают новые горизонты.

Кроме того, скоро голосовые помощники начнут освоение космоса. Сегодня космонавты читают инструкции с ноутбука, что отнимает много времени. Но уже существует робот, который сможет следить за их действиями и давать пошаговое руководство для выполнения поставленных задач. Также с его помощью космонавты всегда будут на связи с Землёй — система будет передавать им последние новости в режиме реального времени.

Немаловажно, что распространение голосовых помощников способствует повышению их эффективности, ведь подобные системы работают на базе искусственного интеллекта и способны самообучаться, а это значит, что с чем большим количеством пользователей они будут «общаться», тем умнее будут становиться.

А какими голосовыми помощниками пользуетесь вы?

2323
2 комментария

Чтобы воспользоваться вашей транскрибацией, нужно номера у вас брать? Или можно загружать свои фонограммы и получать расшифровки?

Добрый день. Вам нужно использовать наш сервис сквозной аналитики. Номера вы можете использовать свои, просто их нужно будет подключить к нашему сервису. Просто загрузить кнам записи разговора для расшифровки не получится.

1