Битва за будущее искусственного интеллекта началась: на сцену выходят агенты

Знаете, что общего между строительством дома и созданием искусственного интеллекта? В обоих случаях есть два пути: собрать команду специалистов или найти одного универсального мастера. Именно об этом сейчас спорят крупнейшие умы Кремниевой долины, и от исхода этого спора зависит будущее технологий.

Недавно я посмотрел выступление Эндрю Ына (Andrew Ng) — человека, которого можно назвать одним из «крёстных отцов» современного ИИ. Он активно продвигает идею «агентного ИИ».

Звучит круто, но что это значит на самом деле?

И почему эта тема внезапно стала такой актуальной?

Отрывок выступления Эндрю, где он рассказывает про агентный подход. Источник: YouTube

Наверняка вы знаемы с «Мстителями», где каждый супергерой отвечает за что-то своё?

Железный Человек — технологии
Тор — сила
Черная Вдова — шпионаж

Первый подход к агентному ИИ работает похоже:

Один ИИ-агент — художник-виртуоз, создающий изображения
Второй — информационный детектив, способный найти любые данные в интернете
Третий — мастер общения, координирующий работу остальных

Представьте, что вы просите такую команду спланировать вам отпуск. Один агент ищет билеты и отели, другой создает визуальный маршрут, третий общается с вами и координирует весь процесс.

Сэм Альтман. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fcontent.techgig.com%2Ftechnology%2Fsam-altman-wants-to-build-agi-at-all-costs-know-why%2Farticleshow%2F109909067.cms&postId=1821096" rel="nofollow noreferrer noopener" target="_blank">Techgig</a>

Второй подход, который продвигает Сэм Альтман (Sam Altman) и его OpenAI, больше похож на Агента Смита из «Матрицы» — одна система, способная делать всё. Это как супергерой, владеющий всеми суперспособностями сразу.

В примере с отпуском это был бы один ИИ-помощник, который сам ищет информацию, сам составляет маршрут, сам визуализирует его и общается с вами.

Самое интересное в этом то, что грань между этими подходами настолько тонкая, что иногда её просто не видно. Это как с нашим мозгом — вроде бы разные участки отвечают за разные функции (речь, зрение, движение), но мы воспринимаем его работу как единое целое.

Однако здесь возникает один ключевой вопрос: а можем ли мы в принципе построить полноценный общий искусственный интеллект (AGI) на основе текущих больших языковых моделей (LLM)?

Ян Лекун (Yann LeCun), один из ведущих исследователей в области ИИ, считает, что LLM не способны достичь AGI в принципе, поскольку текстовые модели в принципе не могут воспроизводить пространственное мышление.

*пространственное мышление*

Они оперируют последовательностями символов и не обладают встроенным пониманием трёхмерного мира, что критично для настоящего интеллекта.

Это фундаментальная проблема для сторонников подхода OpenAI, где всё завязано на развитие одной большой универсальной модели. В отличие от этого, агентный подход, который предлагает Эндрю Ын, потенциально быстрее сможет обойти этот барьер, создавая модульные системы, каждая из которых будет дополнять другую.

Например, один агент может специализироваться на языковых задачах, а другой — на пространственном анализе. Следовательно, вся система в целом будет более «умной».

Таким образом, если рассматривать AGI как систему, которая должна адаптироваться к миру так же, как человек, агентный подход кажется более перспективным. Ведь в реальной жизни мы тоже используем разные ментальные механизмы для разных задач.

Допустим, если взять ChatGPT, то когда вы с ним общаетесь, кажется, что это единая система. Но не исключено, что внутри уже работает целая команда специализированных нейросетей? Наверняка, уже сейчас один модуль отвечает за понимание вашего вопроса, другой — за поиск информации, третий — за формулировку ответа?

В конечном счете может оказаться так, что текущие языковые модели в принципе не позволят нам создать поистине общий искуственный интеллект, которым пугает Сэм Альтман.

Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fmedium.com%2Fbetter-programming%2Fthe-hard-argument-against-llms-being-agi-ffa2e50cb028&postId=1821096" rel="nofollow noreferrer noopener" target="_blank">Ahti Ahde</a>

Для бизнеса: Представьте онлайн-магазин, где один умный ИИ делает всё: общается с клиентами, управляет складом, анализирует продажи. Или команда специализированных ИИ, где каждый отвечает за свой участок. Что эффективнее?
Для индивидуальных пользователей: Хотели бы вы общаться с одним супер-умным ассистентом или предпочли бы разных специалистов для разных задач?

Можно немного пофантазировать: представить ИИ как трансформера, который может быть как единым роботом, так и разделяться на специализированные модули, когда это нужно.

Возможно, скоро мы увидим системы, которые будут подстраиваться под задачу: для простых вопросов работать как единый интеллект, а для сложных проектов разделяться на команду специалистов.

На самом деле, за этим противостоянием подходов кроется более глубокий вопрос: как устроен интеллект вообще?

Может быть, создавая ИИ, мы наконец поймем, как работает наше собственное мышление?

Если тебе интересно не только пользоваться новыми технологиями, но и знать, как они устроены — заглядывай в мой блог «Код без тайн». Там я делюсь своими мыслями и находками из сферы IT и стараюсь рассказывать простым языком о том, как работает техника:

t.me

Код без тайн

Битва за будущее искусственного интеллекта началась: на сцену выходят агенты

Два подхода к рассмотрению агентного ИИ

Путь первый: «Мстители» от мира ИИ 🦸‍♂🦸‍♀

Путь второй: «Агент Смит» — универсальный солдат

Почему это сложнее, чем кажется

Что уже существует в реальности?

Что это значит для пользователей?