{"id":14275,"url":"\/distributions\/14275\/click?bit=1&hash=bccbaeb320d3784aa2d1badbee38ca8d11406e8938daaca7e74be177682eb28b","title":"\u041d\u0430 \u0447\u0451\u043c \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043f\u0440\u043e\u0444\u0435\u0441\u0441\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u043f\u0440\u043e\u0434\u0430\u0432\u0446\u044b \u0430\u0432\u0442\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f72066c6-8459-501b-aea6-770cd3ac60a6"}

Amazon делает умный дом ещё умнее, NVIDIA копирует голоса людей, а весь мир разрабатывает этику ИИ

Осенний дайджест главных новостей и исследований из мира голоса и разговорных технологий: от Meta, Amazon, Яндекса, Spotify и других компаний. Подготовлен на основе телеграм-канала Hey Voice! команды голосовых интерфейсов KODE.

Новости голосовых технологий

1. NVIDIA научилась точно копировать голоса людей

Разработчики NVIDIA представили нейросеть, которая даёт возможность обучать модель собственным голосом, включая тембр, тональность и темп речи. Она также может интонационно выделять ключевые слова и преобразовывать голос одного человека в голос другого.

Новая технология совершенствует разговорный ИИ, который вскоре научится воспроизводить уникальные человеческие интонации. Это отвечает главному тренду в мире voice tech — гуманизации виртуальных помощников, а для бизнеса может стать ключом к повышению лояльности к бренду.

Как работает модель NVIDIA

2. Amazon тотально меняет умный дом на базе Alexa

На октябрьской ежегодной презентации Amazon анонсировала сразу несколько умных устройств и функций: новый термостат, настенный Echo Show и Amazon Glow для интерактивного обучения детей. Также появилось больше продуктов Blink (например, видеодомофон с прожектором).

Но больше всего на себя обратили внимание дрон Always Home Cam с летающей камерой, благодаря которому можно следить за домом, и Amazon Astro — робот, похожий на диснеевского Валли. Формально это Alexa на колесах, которая научилась видеть. Например, Астро может следить за пожилыми членами семьи и детьми, пока вас нет, или сообщать о состоянии других умных устройств в доме.

Amazon Astro CNET

3. Meta (экс-Facebook) и Ray-Ban представили смарт-очки с голосовым управлением

Линейка смарт-очков Ray-Ban Stories — первый продукт многолетнего партнёрства двух компаний. На очках есть физическая кнопка записи фото и видео, но можно обратиться к голосовому помощнику Facebook Assistant, например по команде 'Hey Facebook, take a photo', и он быстро сделает кадр. Пока общаться с ассистентом можно только на английском языке.

Подробный обзор смарт-очков от сообщества разработчиков

4. Spotify выпустил умный плеер с голосовым ассистентом для автомобилей

Аудиодевайс Car Thing устанавливается на вентиляционное отверстие или приборную панель и упрощает доступ к потоковому сервису Spotify. Теперь водители могут включать музыку, запускать плейлисты или подкасты через голосового помощника Spotify или сенсорную панель и джойстик устройства. Также на четыре кнопки можно назначить определённые плейлисты.

В Spotify Car Thing применяется технология преобразования текста в речь (TTS) — VoiceLab, разработанная компанией ReadSpeaker. ИИ генерирует голос, который слышат пользователи, когда говорят 'Hey Spotify', и зачитывает любой текст на экране. Кстати, этот же ИИ обучает пилотированию истребителя F-35 Lightning II.

5. Эксперты из Тинькофф, VK, Just AI, «Додо Пиццы» и KODE выяснили, чем обладает идеальный разговорный продукт

В телеграм-канале Hey Voice! прошёл митап «Идеальный разговорный продукт: что обеспечивает хороший UX?» В результате обсуждения VUI-дизайнеры, редакторы голосовых ассистентов и аналитики разговорных интерфейсов выделили несколько главных вещей для отличного пользовательского опыта:

  • Простая навигация, которая помогает быстро решить задачу пользователя.
  • Персонализация, чтобы была возможность быстро переводить деньги маме или заказывать любимую пиццу фразой «Мне как всегда».
  • Консистентность, которая создаёт общий ToV ассистента. Например, благодаря этому Алиса не будет резко переключаться на мужской голос, если пользователь активирует навык от внешнего разработчика.
  • Подсказки от ассистента, которые помогают узнать о дополнительном функционале, потенциально полезном пользователю.

Послушать запись митапа можно по ссылке, текстовый материал подготовят в ближайшее время.

Отчёты и статистика

1. Яндекс догоняет языковые модели SberDevices, которые признаны лучшими по пониманию текстов на русском языке

По оценке бенчмарка Russian SuperGLUE, в начале осени модели Сбера уступали по точности только человеку. Оценка проводилась на основании того, насколько качественно модель выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста.

К концу года разработка Сбера по-прежнему на первом месте, но на пятки наступает языковая модель Яндекса из семейства YaLM: за осень она обогнала три модели конкурента по пониманию русского языка.

Также языковая модель Яндекса заняла третье место в общем счёте среди всех других моделей. Она содержит 3,3 млрд параметров и учится на больших датасетах. Благодаря ей, например, создан генератор фраз Балабоба, а с середины декабря Алиса начнёт сочинять авторские сказки.

RUSSE — показатель, отвечающий за понимание текстов на русском языке Бенчмарк Russian SuperGLUE

2. Люди с большей вероятностью будут покупать товары голосом, независимо от того, что они покупают

Согласно CouponFollow, 60% пользователей удовлетворены голосовой коммерцией. В онлайн-опросе приняли участие >1000 американцев в возрасте от 18 до 60 лет. Среди них 35,1% респондентов ежедневно общаются с ассистентами, а четверть взаимодействуют с ними несколько раз в неделю.

Около 40% опрошенных регулярно консультируются с помощником о покупках. Чаще всего они узнают о новинках, ищут информацию по конкретным продуктам и создают список покупок. С помощью голосового ассистента люди чаще всего покупают продукты питания (34%) и электронику (28%). Ежемесячно они тратят на это около $1035 (≈75 тысяч рублей).

Около 65% пользователям нравится покупать товары через виртуального ассистента. Особенно они ценят, что это можно делать без помощи рук — это значительно сокращает их время. А беспокойство по-прежнему вызывают безопасность и возможное отслеживание данных.

3. Весь мир разрабатывает этические правила для ИИ

Основная цель всех стран — обеспечить уверенность в том, что ИИ всегда будет находиться под контролем человека. Также разработка свода принципов создаёт конкуренцию и приближает каждую страну к глобальной цели — стать мировым лидером в области ИИ к 2030 году.

Китай уже выпустил свод этических принципов для регулирования ИИ. Акцент в документе сделан на защите прав пользователей и контроле влияния Big Tech. В документе подчёркивается, что у человека должно оставаться право отказаться от ИИ в любой момент.

ЕС и США ещё разрабатывают общий подход к использованию ИИ и управлению данными. К гонке за лидерство также присоединяется и Австралия. Кроме внедрения надёжного, безопасного и ответственного ИИ, которому люди будут доверять, она хочет отразить в своде правил ценности австралийского общества.

В России уже подписали «Кодекс этики ИИ», где утвердили главные принципы внедрения: прозрачность, правдивость, ответственность, надёжность, инклюзивность, беспристрастность, безопасность и конфиденциальность. Пока требования носят только рекомендательный характер.

4. К концу года у жителей России будет >4 млн умных устройств

Рынок голосовых продуктов в России продолжает расти наперекор пандемии, нехватке комплектующих и прогнозам аналитиков. Такую аналитику привёл управляющий партнёр Just AI Кирилл Петров на конференции Conversation'21.

Также опыт использования голосовых ассистентов становится более глубоким и разнообразным. Появляется всё больше пользователей, которые с помощью ассистента управляют домом, ищут рецепты и переводят деньги.

Это пятый дайджест VUI-команды голосовых интерфейсов компании KODE. Главные события в индустрии голоса за июль и август читайте по ссылке.

Команда голосовых интерфейсов уже более 3 лет занимается проектированием и разработкой разговорных продуктов. Вместе с этим активно развивает профсообщество и телеграм-канал, где делится своей экспертизой и свежими новостями индустрии.

Телеграм-канал Hey Voice!

Новости и исследования из мира голосовых технологий и разговорного ИИ

0
Комментарии
-3 комментариев
Раскрывать всегда