{"id":13799,"url":"\/distributions\/13799\/click?bit=1&hash=865a89ddf5e1b9e468c75aafc8397c3511c1f5c9a63c9b3d346956d539f26271","title":"\u042d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e \u043f\u0440\u043e\u0434\u0430\u0432\u0430\u0442\u044c \u043d\u0430 \u00ab\u041c\u0430\u0440\u043a\u0435\u0442\u0435\u00bb ","buttonText":" \u041a\u0430\u043a?","imageUuid":"f7affe9f-a742-5820-ac81-04ba4a1a8f84","isPaidAndBannersEnabled":false}

Главные события из мира голосовых помощников и чат-ботов в 2022 году

Чат-боты становятся всё более разумными, виртуальные секретари избавляют от спама, Алекса летит в космос. Собрали всё, что нужно знать о разговорном ИИ в 2022 году, в одной статье. Бонус — немного об инструментах и прогнозах для профессионалов отрасли.

Самое громкое событие года — ChatGPT от OpenAI

ChatGPT — языковая модель и чат-бот, улучшенная версия нейросети GPT-3.5. Он может просто поболтать или ответить на вопросы, написать сценарий, научную работу или программный код. Одно из ключевых отличий от предыдущих GPT — новая версия обучена не просто продолжать текст, а именно отвечать на вопросы. Ответы, которые даёт бот, удивляют пользователей по всему миру.

Мы: ChatGPT, как убить чат-бота? ChatGPT: Никак, да и вообще мы очень полезны.

Впрочем, паниковать, что нейросети лишат нас многих профессий, пока рано. Их ответы могут выглядеть правдоподобными, но не всегда будут правильными. Об этом уже заявил Stack Overflow. На форуме для разработчиков запретили публиковать ответы ChatGPT, а OpenAI работет над «водяным знаком» для сгенерированных текстов.

«Младший брат» ChatGPT помогает разработчикам на Гитхабе

ChatGPT не единственный бот, который пишет код. В этом году Гитхаб запустил собственный ИИ-сервис — Copilot. При генерации кода Copilot использует миллиарды строк кода из общедоступных репозиториев Гитхаб.

Сервис Copilot также разработан на основе языковой модели OpenAI GPT-3. Сейчас он понимает устную речь, но пока не отвечает голосом. Для ассистента используются пробуждающие фразы «Привет, Гитхаб» или "Hey, Github". Copilot предлагает код, перемещается по нему и находит ошибки. В стадии тестирования голосовое управление поддерживается только в редакторе Visual Studio Code.

Однако и с ним не всё благополучно: программист-юрист из США уже подал в суд иск на компанию за то, что Copilot нарушает условия лицензий Open Source проектов и ущемляет права программистов.

Тренд года в России — виртуальные секретари

В 2022 году три мобильных оператора запустили виртуальных секретарей. В июле Билайн представил целую команду помощников: Дарья, Сергей, Скай, Ника и Крош из «Смешариков». У каждого свой характер и разная функциональность: например Дарья и Крош умеют объяснять, почему владелец телефона не может ответить. В сентября у Мегафона появилась Агент Ева, в ноябре — два виртуальных секретаря от Теле2. Кроме того, на рынке уже существуют ассистент Олег от Тинькофф и виртуальный секретарь Маша от Deepvoice.

Функции всех секретарей примерно одинаковы: защита от спама, ответ на звонок, который пропустил пользователь, запись разговора и расшифровка. Все операторы планируют активно развивать сервисы.

По оценкам команды Just AI, аудитория мобильных секретарей в России сейчас составляет более 1,5 миллиона активных пользователей. Через год она заметно вырастет — прогноз от 5 до 50 миллионов человек.

Алекса полетела в космос

Голосовой помощник от Амазон полетел на Луну в рамках миссии «Артемида-1». Запуск планировали на 29 августа, но несколько раз переносили. В итоге полёт состоялся в ноябре. В рамках миссии корабль в беспилотном режиме облетит Луну, пробудет на её орбите несколько недель и вернётся на Землю.

Одна из задач миссии — понять, сможет ли виртуальный ассистент помогать космонавтам на борту и обеспечивать их безопасность. Алекса получила доступ к данным корабля и может управлять устройствами на борту.

Источник The Verge

Как именно работает голосовой ассистент в космосе без интернета, мы рассказывали в статье на Хабре. Там же пытались найти ответ на вопрос, будут ли российские голосовые ассистенты бороздить просторы Вселенной.

Алиса отметила юбилей и научилась новому

В этом году голосовому помощнику от Яндекса исполнилось 5 лет. К празднику Алиса освоила новый навык «С Днём рождения». Она не только отвечала на вопросы пользователей, но и инициировала диалог.

Алиса задавала философские вопросы: почему сырники называют сырниками, если их делают из творога; почему всегда теряется второй носок, а не первый. Хотя это далеко не весь её репертуар. Алгоритмы ИИ генерировали уникальные вопросы для каждого пользователя на основе истории общения.

Алиса также научилась помогать с выбором техники. На основе ответов пользователей она создаёт список товаров с фото, описанием и ценами. Вызвать навык можно голосовой командой или зайти в раздел «Помоги выбрать» на главной странице Яндекса.

В этом году Яндекс добавил новую фичу и к самим умным устройствам — Яндекс Станция теперь может работать в режиме радионяни. Достаточно установить колонку в комнате, где спит ребёнок, и настроить трансляцию. Станция будет передавать звуки на смартфон или другую колонку.

В странах СНГ создают собственных голосовых помощников

Команда UzbekVoice.ai разрабатывает голосового помощника Азизу. Ближайшая цель — собрать базу данных, на которых будет обучаться помощник.

Пополнить базу может любой носитель языка. Для этого нужно читать тексты на платформе Mozilla Common Voice и проверять их. Самые активные участники получат призы.

Чтобы обучить Азизу общаться с пользователями, команда планирует собрать не менее 300 тысяч часов голосовых записей. База данных будет открытой и бесплатной. В дальнейшем ей смогут пользоваться разработчики и исследователи в области ИИ.

Siri, просто Siri

Apple планирует убрать слово «привет» из фразы для активации голосового помощника. Изменение активационной фразы (wake word) не такая простая задача, как кажется. Вместо двух слов голосовому помощнику придётся научиться распознавать одно, которое люди произносят с разными акцентами. По данным The Verge, Apple планирует выпустить обновление в 2023–2024 году.

Другие голосовые ассистенты уже умеют откликаться только на своё имя, как это делает Алекса. Изменение wake word позволит Apple сравняться в этом плане с Амазон и обойти Гугл, чей голосовой помощник сейчас реагирует на фразы «Окей, Гугл» или «Привет, Гугл».

Голосовые интерфейсы помогают развивать инклюзию

В декабре 2022 года Яндекс объявил, что адаптировал десять сервисов и приложений компании для слабовидящих людей. Слепые воспринимают интерфейс на слух при помощи скринридеров — программ, которые зачитывают всё, что написано на экране.

Гугл создал умную рамку, чтобы слабовидящие люди тоже могли делать селфи. Функция Guided Frame встроена в специальные возможности ассистента Гугл. В ней используются голосовые подсказки и машинное зрение, чтобы камера наиболее точно захватывала лицо пользователя.

Когда пользователь включает фронтальную камеру, голосовой помощник подсказывает, как её расположить, чтобы получить наиболее удачный ракурс. Инструкции просты: переместить телефон вверх, вправо, наклонить вперёд. Как только камера поймает лицо, начнётся обратный отсчёт до снимка.

Инструменты для дизайнеров голосовых интерфейсов

Амазон представил визуальный конструктор диалогов — Visual Conversation Builder. Он позволяет разрабатывать разговорные сценарии без кода: реплики можно просто перетаскивать в нужную часть беседы (drag-and-drop интерфейс). Созданные на основе ИИ чат-боты умеют обрабатывать сценарии со сложными условиями и отвечать на запросы клиентов. Новый визуальный конструктор дополняет ранее представленный компанией сервис для разработки диалоговых интерфейсов Lex.

Visual Conversation Builder не первый такой сервис. Подобные решения уже представлены во FlowXO, Aimylogic и на многих других платформах.

Чтобы пользоваться Lex из России, придётся обойти ряд ограничений: зарегистрироваться по номеру зарубежного оператора сотовой связи и привязать иностранную банковскую карту. Русский язык не поддерживается, нет интеграции с Телеграм, Алисой и другими популярными платформами. Тем не менее, разработка Амазон несомненно займет свою нишу за счет интеграции с AWS и востребованности Алексы.

Оценки и прогнозы рынка

В России. По оценке Just AI, на конец 2022 года рынок разговорного ИИ составит 2,2 млрд. На 2023 год эксперты прогнозируют стагнацию, однако долгосрочный прогноз более оптимистичен — в 2026 году рынок голосового ИИ может вырасти в 12 раз, до 41 млрд рублей.

За рубежом. Универсальность голосовых помощников под вопросом: Гугл постепенно закрывает Google Actions для ассистента, Амазон сокращает людей в командах Алексы. Рост индустрии происходит в основном за счёт внедрения разговорного ИИ в колл-центры. Сейчас по оценке Gartner только 1,6% от количества звонков в колл-центры обрабатывают роботы, но к 2026 году доля вырастет до 10%.

Продажи умных колонок. Яндекс объявил, что со второго квартала умные колонки стали приносить прибыль. Сбер сообщил, что к началу августа продано более миллиона устройств. VK выпускает новые устройства Xiaomi с Марусей и новые Капсулы Нео.

Топ-5 российских умных колонок на конец года выглядит так:

  • Яндекс с Алисой
  • VK с Марусей
  • Xiaomi с Марусей
  • JBL с Алисой
  • Устройство Сбера с ассистентом Салют

С начала года спрос на них вырос на 80%. Умные колонки в 2022 году были едва ли не единственной категорией электроники, интерес к которой рос, в то время как продажи ноутбуков и смартфонов сократились примерно на треть. Люди искали новые эмоции, хотели приобрести новый пользовательский опыт, и колонки могли им это дать.

Это был дайджест главных событий из мира voice tech, подготовленный командой разговорных продуктов KODE. И да, у нас есть телеграм-канал, подписывайтесь!

0
1 комментарий
Виктор Носко

Хм, кажется в статье упущено несколько стартапов, выкативших новые разговорные продукты, например мы запустили первого в России ИИ-психолога Сабину, с которым можно не просто болтать, а решать свои проблемы в сфере тревог, страхов, отношений.
Это наша собственная разработка НЕ основанная на ChatGPT (и выпущена раньше него).
https://vc.ru/tribuna/518295-sabina-ai-ii-avatar-chatbota-psihologa-s-kotorym-mozhno-obshchatsya-kak-s-chelovekom

https://t.me/psycho_ai_chatbot

Ответить
Развернуть ветку
Читать все 1 комментарий
null