Наступает эпоха ИИ-ассистентов – приложения больше не нужны?

На фоне дискуссий о том, как быстро развивается генеративный ИИ, хотелось бы порассуждать на тему того, как это повлияет на цифровые продукты для конечных потребителей в будущем. Моя основная гипотеза заключается в следующем: если AI-ассистенты вроде ChatGPT продолжат развиваться в таком же темпе, это приведет к концу эпохи приложений в том виде, в котором мы это понимаем сейчас.

Кадр из м/ф "The Mitchells vs. The Machines"

Зачем мне из будущего ставить на смартфон отдельное приложение для заказа еды, если я могу попросить ассистента заказать “чего-нибудь соленого к пиву”. Зачем отдельное приложение для поиска авиабилетов и отелей, если я могу попросить ассистента спланировать мою поездку. Поэтому гораздо удобней выглядит подключение поставщика услуг к моему ассистенту и взаимодействие с ним самым интуитивным образом – посредством диалога.

Есть ощущение, что цифровые продукты в будущем трансформируются в нечто вроде адаптеров ИИ к реальному миру – что-то, что будет обеспечивать доступ тех самых умных ассистентов к услугам в оффлайн: заказы товаров и услуг, записи на стрижку или тренировки, доступ к новостям и развлекательному контенту.

Почему я это вижу именно так? На мой взгляд тот же ChatGPT, Siri или Алиса потенциально является универсальным интерфейсом для потребления большого количества услуг. Да, сейчас он может общаться только голосом и текстом, однако я почти уверен, что в будущем он сможет отображать информацию в более структурированом для человека виде: в виде карточек товаров, онлайн-карт с отметками, календарей, интерактивных виджетов, визуальных инструкций и т. д. Тем самым рынок ИИ-ассистентов предложит ультимативные способы взаимодействия с большинством привычных услуг.

Что же делать тогда поставщикам этих услуг? Все просто – интегрироваться в эти экосистемы. По сути это можно начать делать уже сейчас: iOS SDK позволяет создавать кастомные команды для Сири, а Яндекс подробно описывает в своей документации, как создавать собственные навыки для Алисы. Собственно, прямо сейчас довольно много продуктов уже неплохо интегрируются в голосовые ассистенты – из них можно запускать музыку, управлять умным домом, узнавать новости или погоду, следить за результатами спортивных событий. Но пока это довольно примитивные кейсы, которые представляют собой прямой запрос и прямой ответ. Дальнейшее развитие этих инструментов скорее приведет к схеме “абстрактный запрос→анализ и выбор поставщика→персонализированный ответ”.

Потенциальные преимущества такого варианта развития событий заключаются, на мой взгляд, в возможности концентрироваться непосредственно на качестве оказываемой услуги и модели ее монетизации, а не на обертках вокруг нее, вроде системы рекомендаций, витрины и т. п. – это все предоставит тот самый ультимативный интерфейс.

По сути это может казаться похожим на модные нынче супер-аппы, только более модульные, однако подход все же немного иной. Суперапп предлагает при запуске пользователю все сразу, а AI-ассистент не предлагает ничего до того, пока не появится реальная потребность. Он скорее становится ближе к операционным системам.

Это тоже становится определенной проблемой – как рекламировать себя, если пользователь чаще проводит время в интерфейсе ассистента, чем на рекламных площадках. Я думаю, что тут все может происходить по законам рынка, известным нам со школы – спрос рождает предложение. И вполне себе можно пофантазировать о том, что каждое утро ваш ассистент будет сообщать вам проплаченный дайджест со своими новыми навыками, предоставленными поставщиками-рекламодателями.

Круг продуктов, которым придется адаптироваться под новые реалии, достаточно широк, но есть и те, которым это вряд ли грозит, по крайней мере в таком виде, как я описываю выше. Это те приложения, взаимодействие пользователя с которыми непосредственно поставлено во главу угла – например, видеоигры и другие интерактивные развлечения, да и в принципе любые продукты, основанные на интенсивном цикле ввода-вывода.

Можно еще пофантазировать о том, как будут адаптироваться консьюмерские сугубо онлайн продукты. Например, соцсети. Мне кажется, было бы удобно взаимодействовать с ними не только скроллингом и двойным тапом, но и спрашивая у своего ассистента «А как там поживает мой давний знакомый Михаил?” и получая в ответ что-то вроде »Судя по последним постам, Михаил находится в депрессии из-за того, что ИИ отбирает рабочие места. Хотите почитать подробнее?”

В корпоративной же среде уже сейчас большие языковые модели показывают большой потенциал с точки зрения составления и интерпретации отчетов, анализа данных и помощи в рутинных задачах. Да и вообще, люди, которые сейчас активно используют современные генеративные ИИ чаще используют его для повышения эффективности своей работы, чем для облегчения внерабочего быта.

В качестве примера продукта, который отчасти иллюстрирует мое видение может служить недавно выпущенный AI Pin от Humane – умная брошь с доступом к GPT на борту, которая предоставляет спорный, но любопытный интерфейс взаимодействия в виде комбинации лазерного проектора и голосового помощника, при этом без поддержки приложений – для прослушивания музыки используется интеграция бота с сервисом Tidal, что по сути и является тем самым “адаптером к реальному миру”, о котором я говорю.

Наступает эпоха ИИ-ассистентов – приложения больше не нужны?

Похожим принципом воспользовались разработчики нашумевшего на CES 2024 девайса Rabbit R1.

Да, пока что это непривычные и экспериментальные продукты, но на мой взгляд, они как раз неплохо отображает концепцию, к которой современный рынок персональных девайсов скоро может прийти благодаря развитию ИИ-помощников.

Интерфейсы взаимодействия с ними будут становиться более нативными (голос, жесты, изображения и т. п.), а интерфейсы самих сервисов уйдут на второй план. Разговоры об UX все чаще будут не про надписи и кнопки, а про разметку своих данных.

Ну и, как я уже упоминал, эта идея уже начала свое развитие в голосовых помощниках, которые давно на рынке, просто в скором времени эти помощники станут гораздо полезнее благодаря интеграции генеративного ИИ.

Не смотря на то, что голосовые ассистенты уже сейчас многим позволяют чуть быстрее решать рутинные задачи, по-настоящему умные помощники пока еще в самом начале своего пути развития.

Одна из главных нерешенных проблем – вопрос безопасности данных. Многие большие компании сейчас запрещают своим сотрудникам использовать ChatGPT в работе ввиду большого риска утечек – OpenAI хоть из запустила Enterprise программу, по которой они обязываются не использовать полученные данные для обучения модели, однако для простых смертных этот вопрос все еще стоит остро. Не очень-то хочется, чтобы через какое-то время ИИ случайно рассказал всем о твоих привычках или каких-то других сведениях, нежелательных к разглашению.

Вторая проблема – вопрос производительности. Прямо сейчас Microsoft заявляет, что им приходится пересматривать свои взгляды на развитие серверной инфраструктуры из-за OpenAI. Обучение и запуск больших языковых моделей, особенно уровня GPT-4, требует огромного количества вычислительных ресурсов, которых может просто не хватить для качественного рывка с точки зрения скорости и доступности сервиса. Поэтому оффлайн-ассистенты (которые как раз могли бы решить проблему безопасности данных) пока что довольно ограничены в своих возможностях и не там впечатляют, хотя и уже активно внедряются вендорами.

Третья проблема – слишком быстрое развитие моделей генеративного ИИ, из-за чего потребители просто не успевают привыкнуть и осознать всех возможностей и для многих это пока что воспринимается скорее как игрушка. Даже если бы первые две проблемы были бы решены завтра, рынку понадобилось бы еще довольно продолжительное время, чтобы адаптироваться и понять реальную ценность новых поколений ИИ.

А пока все эти проблемы решаются, я бы рекомендовал пристально наблюдать за тем, куда это все свернет. Да, OpenAI, Google, Anthropic и другие компании, судя по всему, действительно меняют мир и мы не можем предсказать, как он будет выглядеть уже через год – к сожалению пока что у гигантов индустрии монополия на реальные масштабные исследования в этой области ввиду наличия огромной инфраструктуры.

Но владельцам цифровых продуктов и поставщикам услуг, вероятно, стоит уже сейчас задумываться о том, как могут видоизмениться их продукты в ближайшем будущем. Моя основная гипотеза состоит в том, что наше представление о персональных девайсах и сервисах для них в скором времени сильно изменится и привычные для нас сейчас интерфейсы перестанут быть основным способом взаимодействия с продуктом.

А что вы думаете на счет того, как развитие AI-ассистентов повлияет на быт конечных потребителей и рынок цифровых продуктов для них?

Наступает эпоха ИИ-ассистентов – приложения больше не нужны?

А что прямо сейчас?

Что сейчас мешает развитию такого сценария?