Это очки или камера? Главное о девайсах со встроенным искусственным интеллектом

Какие задачи выполняют ИИ-устройства и насколько это перспективно.

Это очки или камера? Главное о девайсах со встроенным искусственным интеллектом

Всё, на что искусственный интеллект способен в веб-версиях, приложениях, Telegram-ботах и смартфонах, уже никого не удивляет. А вот устройства, куда он встроен — пока не самая привычная вещь. Сегодня разбираемся: понимают ли ИИ-наушники шотландский акцент и что умеют ИИ-украшения?

Наушники

Задача

Переводить разговоры на язык владельца в режиме реального времени. Управление — сенсорное, как у обычных наушников; голосовое (один или оба варианта); интерфейс приложения.

Главное об устройстве

Наушники захватывают голос через встроенный микрофон и очищают от шумов с помощью встроенной функции управления. Далее — распознание текста, перевод, озвучка пользователю. Как правило, эти операции проходят в облаке, при этом некоторые модели способны работать и офлайн без подключения к интернету. Хотя в этом режиме наушники поддерживают только основные языки. А в среднем ИИ-наушники «знают» 30-40 языков и ещё несколько десятков акцентов. По идее, мультфильм «Храбрая сердцем» (знаменитый шотландским акцентом) в оригинале посмотреть можно.

Почему это перспективно

Наушники — определённо удачный форм-фактор для искусственного интеллекта. Пользователи к нему давно привыкли, порог вхождения низкий. Так что на рынке уже есть выбор ИИ-переводчиков-в-ухе.

Для основных языков (и в тихой обстановке) наушники способны обеспечить более 90% точности с задержкой перевода менее секунды. Словом, «вавилонская рыбка» из «Автостопом по галактике» уже здесь. Но точность перевода сильно зависит от популярности языка и сложности предложений; ещё её снижают сильный шум на фоне и слэнговые слова.

Украшения

Задача

Обеспечивать владельцу услуги личного ассистента благодаря искусственному интеллекту. Управление через голосовой или механический интерфейс, а иногда — через приложение.

Главное об устройстве

Сейчас ИИ-украшения существуют в форм-факторах подвесок на шею, брошей, браслетов. Довольно крупных — минимум 30 мм x 10 мм.

Украшения с искусственным интеллектом рассчитаны на людей, которые много работают и часто ходят на встречи — они помогают фиксировать и систематизировать коммуникации в течение дня. Для использования устройства нужно приложение на смартфоне. Функции украшения зависят от бренда:

  • В приложении расшифровка встреч может превращаться в конспект или ключевые пункты встречи.
  • Некоторые ИИ-украшения способны «выцеплять» из разговоров предстоящие задачи и собирать в списки.
  • К устройству могут прилагаться опции создания заметок, напоминаний, ведения календарей. Существует даже украшение с определителем когнитивных искажений. В приложении владелец видит, какие из искажений проявляет на встречах, и получает советы, как думать объективно.

Украшения, как и другие поверхности для ИИ, чаще всего работают по модели подписки. Выходит, что владелец каждый месяц оплачивает искусственный интеллект в своём футуристическом устройстве.

Почему это перспективно

Во-первых, украшения — привычный форм-фактор. Во-вторых, у этих устройств понятная целевая аудитория: люди, которым нужен персональный ассистент. Даже если он — искусственный интеллект на шее или лацкане пиджака. А вот в какую сторону двинутся ИИ-украшения дальше — это очень интересный вопрос.

Телевизоры и колонки

Задача

Помогать пользователю в решении бытовых задач, частично заменяя дома смартфон. Основной интерфейс — голосовой (просмотр фильмов и сериалов функцией искусственного интеллекта не считается).

Как это работает

Встроенные в специальный блок микрофоны активируются по споттерному слову — к примеру, у интеллектуальных устройств Sber это «Салют». Речь начинает стримиться на облачный сервер; там же происходит распознавание речи, подготовка ответа и синтез голосового ответа.

В умном телевизоре с голосовым управлением Sber искусственный интеллект ГигаЧат позволяет контролировать воспроизведение: искать контент, переключать его, ставить на паузу, делать громче/тише и так далее. Кроме того, и умный ТВ, и умные колонки способны:

  • рассказывать о погоде и пробках;
  • ставить таймеры и будильники;
  • искать и включать песни, подкасты, аудиокниги;
  • отвечать на вопросы, рассказывать интересные факты и в целом разговаривать с пользователем;
  • включать устройства умного дома, создавать сценарии (в том числе в случае устройств Sber — сценарии с ИИ ГигаЧат).
Это очки или камера? Главное о девайсах со встроенным искусственным интеллектом

Почему это перспективно

Телевизор — понятная вещь, он есть почти в каждом доме; значит, людям не нужно привыкать к этому форм-фактору. А умная колонка — это простой и доступный вход во все возможности ИИ для решения самых разнообразных задач. К тому же для ТВ голосовой интерфейс совершенно естественен: ну кто ни разу не разговаривал с телевизором?

Очки

Задача

Решать запросы пользователя в режиме реального времени. Управление этим типом устройств — голосовое благодаря микрофонам на стыке оправы и дужки, а интерфейс вывода — визуальный и голосовой.

Как это работает

Самые простые задачи выполняются локально, остальные — на облачном сервере. ИИ-очки требуют приложения для настройки и кастомизации. Конкретный набор функций, как и в других форм-факторах, зависит от модели и бренда, но вот базовые:

  • навигация;
  • перевод с других языков в режиме реального времени;
  • звонки и оповещения;
  • ответы на вопросы. Например, ИИ-очки могут подсказать, на что вы смотрите. Заменить на работе второй монитор, озвучивая/отображая информацию, которая вам необходима.
  • для моделей с камерой — съёмка фото и видео, а также стрим видео с очков.

Электронный модуль (IMU) позволяет определять положение владельца в пространстве — проще говоря, понимать, куда поворачивается голова в очках, с какой скоростью и так далее.

Почему это перспективно

Очки предоставляют пользователю симбиоз возможностей смартфона и ИИ-приложений: быстро перевести текст, выяснить, на что вы смотрите, узнать дорогу до нужного места и так далее. Способны они и частично заменить наушники. Пока основных проблем у ИИ-очков две: во-первых, время автономной работы (менее суток, а в среднем 8 часов). Во-вторых — проблема конфиденциальности третьих лиц.

***

Сейчас привычная для пользователя парадигма использования искусственного интеллекта — это смартфон: приложение, Telegram-бот или веб-версия в браузере. Экспериментируя с новыми форм-факторами, компании ищут самый «естественный», самый нативный для человека формат взаимодействия с искусственным интеллектом. Подобные устройства точно способны взять на себя часть задач. А вот появится ли на рынке «убийца смартфона» — вопрос открытый.

1
2 комментария