Наступает эпоха ИИ-ассистентов – приложения больше не нужны?
На фоне дискуссий о том, как быстро развивается генеративный ИИ, хотелось бы порассуждать на тему того, как это повлияет на цифровые продукты для конечных потребителей в будущем. Моя основная гипотеза заключается в следующем: если AI-ассистенты вроде ChatGPT продолжат развиваться в таком же темпе, это приведет к концу эпохи приложений в том виде, в котором мы это понимаем сейчас.
Зачем мне из будущего ставить на смартфон отдельное приложение для заказа еды, если я могу попросить ассистента заказать “чего-нибудь соленого к пиву”. Зачем отдельное приложение для поиска авиабилетов и отелей, если я могу попросить ассистента спланировать мою поездку. Поэтому гораздо удобней выглядит подключение поставщика услуг к моему ассистенту и взаимодействие с ним самым интуитивным образом – посредством диалога.
Есть ощущение, что цифровые продукты в будущем трансформируются в нечто вроде адаптеров ИИ к реальному миру – что-то, что будет обеспечивать доступ тех самых умных ассистентов к услугам в оффлайн: заказы товаров и услуг, записи на стрижку или тренировки, доступ к новостям и развлекательному контенту.
Почему я это вижу именно так? На мой взгляд тот же ChatGPT, Siri или Алиса потенциально является универсальным интерфейсом для потребления большого количества услуг. Да, сейчас он может общаться только голосом и текстом, однако я почти уверен, что в будущем он сможет отображать информацию в более структурированом для человека виде: в виде карточек товаров, онлайн-карт с отметками, календарей, интерактивных виджетов, визуальных инструкций и т. д. Тем самым рынок ИИ-ассистентов предложит ультимативные способы взаимодействия с большинством привычных услуг.
Что же делать тогда поставщикам этих услуг? Все просто – интегрироваться в эти экосистемы. По сути это можно начать делать уже сейчас: iOS SDK позволяет создавать кастомные команды для Сири, а Яндекс подробно описывает в своей документации, как создавать собственные навыки для Алисы. Собственно, прямо сейчас довольно много продуктов уже неплохо интегрируются в голосовые ассистенты – из них можно запускать музыку, управлять умным домом, узнавать новости или погоду, следить за результатами спортивных событий. Но пока это довольно примитивные кейсы, которые представляют собой прямой запрос и прямой ответ. Дальнейшее развитие этих инструментов скорее приведет к схеме “абстрактный запрос→анализ и выбор поставщика→персонализированный ответ”.
Потенциальные преимущества такого варианта развития событий заключаются, на мой взгляд, в возможности концентрироваться непосредственно на качестве оказываемой услуги и модели ее монетизации, а не на обертках вокруг нее, вроде системы рекомендаций, витрины и т. п. – это все предоставит тот самый ультимативный интерфейс.
По сути это может казаться похожим на модные нынче супер-аппы, только более модульные, однако подход все же немного иной. Суперапп предлагает при запуске пользователю все сразу, а AI-ассистент не предлагает ничего до того, пока не появится реальная потребность. Он скорее становится ближе к операционным системам.
Это тоже становится определенной проблемой – как рекламировать себя, если пользователь чаще проводит время в интерфейсе ассистента, чем на рекламных площадках. Я думаю, что тут все может происходить по законам рынка, известным нам со школы – спрос рождает предложение. И вполне себе можно пофантазировать о том, что каждое утро ваш ассистент будет сообщать вам проплаченный дайджест со своими новыми навыками, предоставленными поставщиками-рекламодателями.
Круг продуктов, которым придется адаптироваться под новые реалии, достаточно широк, но есть и те, которым это вряд ли грозит, по крайней мере в таком виде, как я описываю выше. Это те приложения, взаимодействие пользователя с которыми непосредственно поставлено во главу угла – например, видеоигры и другие интерактивные развлечения, да и в принципе любые продукты, основанные на интенсивном цикле ввода-вывода.
Можно еще пофантазировать о том, как будут адаптироваться консьюмерские сугубо онлайн продукты. Например, соцсети. Мне кажется, было бы удобно взаимодействовать с ними не только скроллингом и двойным тапом, но и спрашивая у своего ассистента «А как там поживает мой давний знакомый Михаил?” и получая в ответ что-то вроде »Судя по последним постам, Михаил находится в депрессии из-за того, что ИИ отбирает рабочие места. Хотите почитать подробнее?”
В корпоративной же среде уже сейчас большие языковые модели показывают большой потенциал с точки зрения составления и интерпретации отчетов, анализа данных и помощи в рутинных задачах. Да и вообще, люди, которые сейчас активно используют современные генеративные ИИ чаще используют его для повышения эффективности своей работы, чем для облегчения внерабочего быта.
А что прямо сейчас?
В качестве примера продукта, который отчасти иллюстрирует мое видение может служить недавно выпущенный AI Pin от Humane – умная брошь с доступом к GPT на борту, которая предоставляет спорный, но любопытный интерфейс взаимодействия в виде комбинации лазерного проектора и голосового помощника, при этом без поддержки приложений – для прослушивания музыки используется интеграция бота с сервисом Tidal, что по сути и является тем самым “адаптером к реальному миру”, о котором я говорю.
Похожим принципом воспользовались разработчики нашумевшего на CES 2024 девайса Rabbit R1.
Да, пока что это непривычные и экспериментальные продукты, но на мой взгляд, они как раз неплохо отображает концепцию, к которой современный рынок персональных девайсов скоро может прийти благодаря развитию ИИ-помощников.
Интерфейсы взаимодействия с ними будут становиться более нативными (голос, жесты, изображения и т. п.), а интерфейсы самих сервисов уйдут на второй план. Разговоры об UX все чаще будут не про надписи и кнопки, а про разметку своих данных.
Ну и, как я уже упоминал, эта идея уже начала свое развитие в голосовых помощниках, которые давно на рынке, просто в скором времени эти помощники станут гораздо полезнее благодаря интеграции генеративного ИИ.
Что сейчас мешает развитию такого сценария?
Не смотря на то, что голосовые ассистенты уже сейчас многим позволяют чуть быстрее решать рутинные задачи, по-настоящему умные помощники пока еще в самом начале своего пути развития.
Одна из главных нерешенных проблем – вопрос безопасности данных. Многие большие компании сейчас запрещают своим сотрудникам использовать ChatGPT в работе ввиду большого риска утечек – OpenAI хоть из запустила Enterprise программу, по которой они обязываются не использовать полученные данные для обучения модели, однако для простых смертных этот вопрос все еще стоит остро. Не очень-то хочется, чтобы через какое-то время ИИ случайно рассказал всем о твоих привычках или каких-то других сведениях, нежелательных к разглашению.
Вторая проблема – вопрос производительности. Прямо сейчас Microsoft заявляет, что им приходится пересматривать свои взгляды на развитие серверной инфраструктуры из-за OpenAI. Обучение и запуск больших языковых моделей, особенно уровня GPT-4, требует огромного количества вычислительных ресурсов, которых может просто не хватить для качественного рывка с точки зрения скорости и доступности сервиса. Поэтому оффлайн-ассистенты (которые как раз могли бы решить проблему безопасности данных) пока что довольно ограничены в своих возможностях и не там впечатляют, хотя и уже активно внедряются вендорами.
Третья проблема – слишком быстрое развитие моделей генеративного ИИ, из-за чего потребители просто не успевают привыкнуть и осознать всех возможностей и для многих это пока что воспринимается скорее как игрушка. Даже если бы первые две проблемы были бы решены завтра, рынку понадобилось бы еще довольно продолжительное время, чтобы адаптироваться и понять реальную ценность новых поколений ИИ.
А пока все эти проблемы решаются, я бы рекомендовал пристально наблюдать за тем, куда это все свернет. Да, OpenAI, Google, Anthropic и другие компании, судя по всему, действительно меняют мир и мы не можем предсказать, как он будет выглядеть уже через год – к сожалению пока что у гигантов индустрии монополия на реальные масштабные исследования в этой области ввиду наличия огромной инфраструктуры.
Но владельцам цифровых продуктов и поставщикам услуг, вероятно, стоит уже сейчас задумываться о том, как могут видоизмениться их продукты в ближайшем будущем. Моя основная гипотеза состоит в том, что наше представление о персональных девайсах и сервисах для них в скором времени сильно изменится и привычные для нас сейчас интерфейсы перестанут быть основным способом взаимодействия с продуктом.
А что вы думаете на счет того, как развитие AI-ассистентов повлияет на быт конечных потребителей и рынок цифровых продуктов для них?