Это очки или камера? Главное о девайсах со встроенным искусственным интеллектом
Какие задачи выполняют ИИ-устройства и насколько это перспективно.
Всё, на что искусственный интеллект способен в веб-версиях, приложениях, Telegram-ботах и смартфонах, уже никого не удивляет. А вот устройства, куда он встроен — пока не самая привычная вещь. Сегодня разбираемся: понимают ли ИИ-наушники шотландский акцент и что умеют ИИ-украшения?
Наушники
Задача
Переводить разговоры на язык владельца в режиме реального времени. Управление — сенсорное, как у обычных наушников; голосовое (один или оба варианта); интерфейс приложения.
Главное об устройстве
Наушники захватывают голос через встроенный микрофон и очищают от шумов с помощью встроенной функции управления. Далее — распознание текста, перевод, озвучка пользователю. Как правило, эти операции проходят в облаке, при этом некоторые модели способны работать и офлайн без подключения к интернету. Хотя в этом режиме наушники поддерживают только основные языки. А в среднем ИИ-наушники «знают» 30-40 языков и ещё несколько десятков акцентов. По идее, мультфильм «Храбрая сердцем» (знаменитый шотландским акцентом) в оригинале посмотреть можно.
Почему это перспективно
Наушники — определённо удачный форм-фактор для искусственного интеллекта. Пользователи к нему давно привыкли, порог вхождения низкий. Так что на рынке уже есть выбор ИИ-переводчиков-в-ухе.
Для основных языков (и в тихой обстановке) наушники способны обеспечить более 90% точности с задержкой перевода менее секунды. Словом, «вавилонская рыбка» из «Автостопом по галактике» уже здесь. Но точность перевода сильно зависит от популярности языка и сложности предложений; ещё её снижают сильный шум на фоне и слэнговые слова.
Украшения
Задача
Обеспечивать владельцу услуги личного ассистента благодаря искусственному интеллекту. Управление через голосовой или механический интерфейс, а иногда — через приложение.
Главное об устройстве
Сейчас ИИ-украшения существуют в форм-факторах подвесок на шею, брошей, браслетов. Довольно крупных — минимум 30 мм x 10 мм.
Украшения с искусственным интеллектом рассчитаны на людей, которые много работают и часто ходят на встречи — они помогают фиксировать и систематизировать коммуникации в течение дня. Для использования устройства нужно приложение на смартфоне. Функции украшения зависят от бренда:
- В приложении расшифровка встреч может превращаться в конспект или ключевые пункты встречи.
- Некоторые ИИ-украшения способны «выцеплять» из разговоров предстоящие задачи и собирать в списки.
- К устройству могут прилагаться опции создания заметок, напоминаний, ведения календарей. Существует даже украшение с определителем когнитивных искажений. В приложении владелец видит, какие из искажений проявляет на встречах, и получает советы, как думать объективно.
Украшения, как и другие поверхности для ИИ, чаще всего работают по модели подписки. Выходит, что владелец каждый месяц оплачивает искусственный интеллект в своём футуристическом устройстве.
Почему это перспективно
Во-первых, украшения — привычный форм-фактор. Во-вторых, у этих устройств понятная целевая аудитория: люди, которым нужен персональный ассистент. Даже если он — искусственный интеллект на шее или лацкане пиджака. А вот в какую сторону двинутся ИИ-украшения дальше — это очень интересный вопрос.
Телевизоры и колонки
Задача
Помогать пользователю в решении бытовых задач, частично заменяя дома смартфон. Основной интерфейс — голосовой (просмотр фильмов и сериалов функцией искусственного интеллекта не считается).
Как это работает
Встроенные в специальный блок микрофоны активируются по споттерному слову — к примеру, у интеллектуальных устройств Sber это «Салют». Речь начинает стримиться на облачный сервер; там же происходит распознавание речи, подготовка ответа и синтез голосового ответа.
В умном телевизоре с голосовым управлением Sber искусственный интеллект ГигаЧат позволяет контролировать воспроизведение: искать контент, переключать его, ставить на паузу, делать громче/тише и так далее. Кроме того, и умный ТВ, и умные колонки способны:
- рассказывать о погоде и пробках;
- ставить таймеры и будильники;
- искать и включать песни, подкасты, аудиокниги;
- отвечать на вопросы, рассказывать интересные факты и в целом разговаривать с пользователем;
- включать устройства умного дома, создавать сценарии (в том числе в случае устройств Sber — сценарии с ИИ ГигаЧат).
Почему это перспективно
Телевизор — понятная вещь, он есть почти в каждом доме; значит, людям не нужно привыкать к этому форм-фактору. А умная колонка — это простой и доступный вход во все возможности ИИ для решения самых разнообразных задач. К тому же для ТВ голосовой интерфейс совершенно естественен: ну кто ни разу не разговаривал с телевизором?
Очки
Задача
Решать запросы пользователя в режиме реального времени. Управление этим типом устройств — голосовое благодаря микрофонам на стыке оправы и дужки, а интерфейс вывода — визуальный и голосовой.
Как это работает
Самые простые задачи выполняются локально, остальные — на облачном сервере. ИИ-очки требуют приложения для настройки и кастомизации. Конкретный набор функций, как и в других форм-факторах, зависит от модели и бренда, но вот базовые:
- навигация;
- перевод с других языков в режиме реального времени;
- звонки и оповещения;
- ответы на вопросы. Например, ИИ-очки могут подсказать, на что вы смотрите. Заменить на работе второй монитор, озвучивая/отображая информацию, которая вам необходима.
- для моделей с камерой — съёмка фото и видео, а также стрим видео с очков.
Электронный модуль (IMU) позволяет определять положение владельца в пространстве — проще говоря, понимать, куда поворачивается голова в очках, с какой скоростью и так далее.
Почему это перспективно
Очки предоставляют пользователю симбиоз возможностей смартфона и ИИ-приложений: быстро перевести текст, выяснить, на что вы смотрите, узнать дорогу до нужного места и так далее. Способны они и частично заменить наушники. Пока основных проблем у ИИ-очков две: во-первых, время автономной работы (менее суток, а в среднем 8 часов). Во-вторых — проблема конфиденциальности третьих лиц.
***
Сейчас привычная для пользователя парадигма использования искусственного интеллекта — это смартфон: приложение, Telegram-бот или веб-версия в браузере. Экспериментируя с новыми форм-факторами, компании ищут самый «естественный», самый нативный для человека формат взаимодействия с искусственным интеллектом. Подобные устройства точно способны взять на себя часть задач. А вот появится ли на рынке «убийца смартфона» — вопрос открытый.