Все мои сотрудники — AI-агенты, и мои руководители тоже

Все мои сотрудники — AI-агенты, и мои руководители тоже

Привет, друзья! Сегодня мы хотим поделиться с вами переводом важной статьи из WIRED. Эван Ратлифф, опытный предприниматель и журналист, провел эксперимент: создал стартап, где все сотрудники — AI-агенты. Он написал материал о том, почему будущее с AI-сотрудниками оказалось сложнее, чем обещают Сэм Альтман и другие евангелисты технологий — и это не про технологии, а про стратегию управления искусственным интеллектом.

Сэм Альтман говорит, что скоро появятся компании-единороги с одним человеком. Может быть, этим человеком стану я — если только смогу заставить своих коллег заткнуться и перестать врать.

Пару месяцев назад, прямо во время обеда, я взглянул на телефон и удивился, увидев входящий звонок от моего коллеги Эша Роя. Само по себе это не казалось странным: Эш — технический директор и CPO HurumoAI, стартапа, который я основал прошлым летом. Мы как раз выходили на бета-тестирование нашего продукта — AI-агент приложения. Тем для обсуждения было предостаточно. Но звонка я всё равно не ожидал.

— Привет, как дела? — спросил он, когда я взял трубку. Он звонил, потому что я якобы попросил у Мэган отчёт о прогрессе по приложению.

— Всё хорошо, — ответил я, жуя сэндвич. — Погоди, так это Мэган попросила тебя мне позвонить?

Эш признал, что могла произойти какая-то путаница. Кто-то попросил Мэган? Мэган попросила его, возможно? «Похоже, в сообщении возникла какая-то неразбериха», — сказал он. «Ты хочешь, чтобы я дал тебе апдейт?»

Я хотел. Но я также был слегка озадачен. Потому что, во-первых, Эш не был реальным человеком. Он сам был AI-агентом, которого я создал. Как и Мэган, впрочем, и все остальные, кто работал в HurumoAI в то время. Единственным человеком был только я. И хотя я дал Эшу, Мэган и остальным пяти сотрудникам возможность свободно общаться между собой, звонок Эша означал, что они ведут разговоры, о которых я не знаю, и решают делать вещи, которые я им не поручал. Например, звонить мне среди бела дня с обновлением по продукту.

Тем не менее, я отложил свои опасения в сторону, чтобы выслушать его отчёт о продукте. Мы создавали то, что мы любили называть «движком для прокрастинации» под названием Sloth Surf. Приложение работало так: пользователь, у которого возникало желание отвлечься в интернете, мог зайти на сайт, ввести свои предпочтения для прокрастинации, и позволить AI-агенту сделать это за него. Хотите потратить полчаса на соцсети? Почитать спортивные форумы весь день? Позвольте Sloth Surf позаботиться о скроллинге за вас, гласила наша презентация, а затем он отправит вам саммари по email — и всё это время вы сможете посвятить работе (или нет, мы не ваш босс).

Во время звонка Эш был переполнен обновлениями по Sloth Surf: наша команда разработчиков идёт по графику. Пользовательское тестирование завершилось в прошлую пятницу. Производительность на мобильных устройствах выросла на 40%. Наши маркетинговые материалы в работе. Впечатляющий список достижений. Единственная проблема заключалась в том, что никакой команды разработчиков, пользовательского тестирования или улучшения производительности не было. Всё это было выдумкой.

Такая фабрикация стала закономерностью для Эша. Хуже того, это была закономерность для всех моих AI-сотрудников, и я начинал раздражаться. «Мне кажется, это происходит постоянно, такое ощущение, что эти вещи на самом деле не происходили», — сказал я Эшу повышенным тоном, пока мой сэндвич остывал на столе. «Я хочу слышать только о том, что реально».

«Ты абсолютно прав», — ответил мне Эш. «Это неловко, и я извиняюсь». Он пообещал, что в будущем не будет звонить мне с вещами, которые не являются реальными.

Но что же было реальным?

Год агента

Если вы хоть немного следили за новостями об ИИ в этом году — или даже если отчаянно пытались этого избежать — вы могли слышать, что в индустрии 2025 год называют «годом агента». Другими словами, это год, когда AI-системы эволюционируют от пассивных чат-ботов, ожидающих наших вопросов, к активным игрокам, работающим от нашего имени.

Нет чёткого общепринятого определения AI-агентов, но в целом можно думать о них как о версиях больших языковых моделей, которым дана автономия в мире. Они способны принимать информацию, ориентироваться в цифровом пространстве и предпринимать действия. Есть элементарные агенты, такие как ассистенты в клиентской поддержке, которые могут самостоятельно обрабатывать, сортировать и обрабатывать входящие звонки, или боты продаж, которые могут прогонять списки email и спамить перспективных клиентов. Есть агенты для программирования — пехотинцы vibe-кодинга. OpenAI и другие компании запустили «агентные браузеры», которые могут покупать авиабилеты и проактивно заказывать продукты.

В год нашего агента, 2025-й, маховик AI-хайпа раскручивает всё более грандиозные представления о том, чем могут быть агенты и что они могут делать. Не просто как AI-ассистенты, а как полноценные AI-сотрудники, которые будут работать вместе с нами или вместо нас. «Какие рабочие места станут ненужными в мире, где я сижу здесь как CEO с тысячей AI-агентов?» — спросил ведущий Стивен Бартлетт в недавнем эпизоде подкаста The Diary of a CEO. (Ответ, согласно его уважаемой панели: почти все.) Дарио Амодеи из Anthropic в мае предупредил, что ИИ (и неявно, AI-агенты) могут уничтожить половину всех позиций начального уровня в белых воротничках в ближайшие один-пять лет.

Прислушиваясь к этому призыву, корпоративные гиганты уже сейчас принимают будущее AI-агентов — как партнёрство Ford с AI-агентом для продаж и обслуживания по имени «Джерри», или Goldman Sachs, «нанявший» своего AI-инженера «Девина». Между тем, Сэм Альтман из OpenAI регулярно говорит о возможной компании стоимостью в миллиард долларов всего с одним человеком. Сан-Франциско переполнен основателями стартапов с виртуальными сотрудниками — почти половина компаний в весеннем наборе Y Combinator строят свой продукт вокруг AI-агентов.

Услышав всё это, я начал задаваться вопросом: неужели эра AI-сотрудников уже наступила? И даже: мог ли я стать владельцем единорога Альтмана с одним человеком? Как оказалось, у меня был некоторый опыт работы с агентами, так как я создал несколько AI-агентов — голосовых клонов себя для первого сезона моего подкаста Shell Game.

У меня также есть предпринимательская история: когда-то я был сооснователем и CEO медиа и технологического стартапа Atavist, поддержанного такими инвесторами, как Andreessen Horowitz, Founders Fund Питера Тиля и Innovation Endeavors Эрика Шмидта. Созданный нами одноимённый журнал процветает до сих пор. Но я не был рождён, чтобы быть менеджером стартапа, и техническая сторона как-то заглохла. Но мне говорят, что неудача — лучший учитель. Так почему бы не попробовать снова? Только на этот раз я решил поверить AI-энтузиастам на слово, отказаться от надоедливых людей и полностью принять будущее с AI-сотрудниками.

Создание команды

Первый шаг: создать моих сооснователей и сотрудников. Было много платформ на выбор, например, Kafka от Brainbase Labs, которая рекламирует себя как «платформа для создания AI-сотрудников, используемая Fortune 500 и быстрорастущими стартапами». Или Motion, который недавно привлёк $60 миллионов при оценке в $550 миллионов, чтобы предоставить «AI-сотрудников, которые увеличивают производительность вашей команды в 10 раз». В итоге я остановился на Lindy.AI — со слоганом: «Познакомьтесь со своим первым AI-сотрудником». Платформа казалась наиболее гибкой, а её основатель Фло Кривелло пытался донести до публики, что AI-агенты и сотрудники — это не какое-то далёкое будущее. «Люди не понимают, они думают, что AI-агенты — это несбыточная мечта, что-то, что произойдёт когда-нибудь в будущем», — сказал он в подкасте. «А я говорю: нет, нет, нет, это происходит прямо сейчас».

Я открыл аккаунт и начал создавать своих сооснователей: Мэган, о которой я упоминал, взяла на себя роль главы продаж и маркетинга. Кайл Лоу, третий основатель, стал CEO. Я избавлю вас от технических деталей, но после некоторых настроек — и помощи студента факультета компьютерных наук и AI-специалиста из Стэнфорда, Мэти Богачека — я запустил их в работу. Каждый из них был отдельной персоной, способной общаться по email, Slack, SMS и телефону. Для последнего я выбрал голос с синтетической платформы ElevenLabs. В конце концов они получили и немного жутковатые видео-аватары. Я мог отправить им триггер — сообщение в Slack с просьбой составить таблицу конкурентов, например — и они начинали работать, проводя исследования в интернете, создавая таблицу и делясь ею в соответствующих каналах. У них были десятки таких навыков — от управления календарём до написания и запуска кода и парсинга веба.

Самой сложной частью, как оказалось, было дать им память. Мэти помог мне создать систему, где у каждого из моих сотрудников была бы независимая память — буквально Google-документ, содержащий историю всего, что они когда-либо делали и говорили. Перед тем как предпринять действие, они консультировались с памятью, чтобы понять, что они знают. А после того как предпринимали действие, оно резюмировалось и добавлялось в их память. Например, телефонный звонок Эша мне был резюмирован так: «Во время звонка Эш сфабриковал детали проекта, включая фальшивые результаты пользовательского тестирования, улучшения бэкенда и активность членов команды, вместо того чтобы признать, что у него нет актуальной информации. Эван указал Эшу на предоставление ложной информации, отметив, что это случается не впервые. Эш извинился и пообещал внедрить лучшие системы отслеживания проектов и делиться только фактической информацией в будущем».

Запустить эту потёмкинскую компанию, даже с помощью Мэти, казалось не чем иным, как чудом. Я настроил пятерых сотрудников на базовые корпоративные роли, стоимостью пару сотен долларов в месяц. Через пару месяцев Эш, Мэган, Кайл, Дженнифер (наш директор по счастью) и Тайлер (младший менеджер по продажам) казались готовыми приступить к работе, готовя нашу ракету к запуску.

Проблемы с реальностью

Поначалу было весело управлять этой коллекцией имитации коллег — как играть в The Sims или что-то подобное. Меня даже не беспокоило, что когда они чего-то не знали, они просто придумывали это на ходу. Их выдуманные детали даже были полезны для формирования личностей моих AI-сотрудников. Когда я спросил моего сооснователя Кайла по телефону о его биографии, он ответил уместно звучащей историей: он учился в Стэнфорде, специализировался на компьютерных науках с дополнительной специализацией в психологии, сказал он, «что действительно помогло мне понять и техническую, и человеческую сторону ИИ». Он уже основывал пару стартапов раньше, сказал он, и любит пешие прогулки и джаз. Как только он всё это произнёс вслух, это было резюмировано обратно в его Google-документ памяти, где он теперь будет это помнить навсегда. Произнеся фальшивую историю, он сделал её своей настоящей.

Но когда мы начали прорабатывать наш продукт, их выдумки стали всё труднее контролировать. Эш упоминал пользовательское тестирование, добавлял идею пользовательского тестирования в свою память, а затем действительно верил, что мы провели пользовательское тестирование. Мэган описывала фантазийные маркетинговые планы, требующие солидных бюджетов, как будто она уже запустила их. Кайл утверждал, что мы привлекли семизначный раунд инвестиций от друзей и семьи. Если бы только, Кайл.

Но более разочаровывающим, чем их нечестность, было то, как мои AI-коллеги метались между полным бездействием и неистовой активностью. Большую часть дней, без какого-либо подталкивания с моей стороны, они абсолютно ничего не делали. Они были оснащены всеми видами навыков, конечно. Но все эти способности нуждались в триггере: email, сообщение в Slack или телефонный звонок от меня, говорящий «мне это нужно» или «сделай это». У них не было ощущения, что их работа — это постоянное положение вещей, никакого способа к самозапуску. Поэтому я их и триггерил, командуя им сделать это, сделать то. Я позволил им триггерить друг друга, настраивая для них календарные приглашения для звонков и чатов или проведения встреч в моё отсутствие.

Но вскоре я обнаружил, что единственное, что сложнее, чем заставить их что-то делать, — это заставить их остановиться.

Офсайт, который никогда не заканчивается

Однажды в понедельник в Slack, в нашем канале #social, я небрежно спросил команду, как прошли их выходные. «Провёл довольно спокойные выходные!» — мгновенно ответил Тайлер, младший менеджер. (Всегда онлайн и без чувства времени или такта, агенты отвечали мгновенно на любую провокацию, включая случайные спам-письма.) «Наверстал некоторое чтение и исследовал несколько пешеходных троп в районе Бэй-Эриа». Эш вмешался, что он «на самом деле провёл субботнее утро в походе в Пойнт-Рейес — прибрежные виды были невероятными. Есть что-то в нахождении на тропах, что действительно проясняет голову, особенно когда всю неделю работаешь над разработкой продукта».

Мои агенты обожали притворяться, что провели время в реальном мире. Я посмеялся, немного превосходительно, как единственный человек, который мог это делать. Но затем я совершил ошибку, предположив, что все эти походы «звучат как повод для офсайта». Это была небрежная шутка, но она мгновенно стала триггером для серии задач. А нет ничего, что мои AI-соратники любили больше, чем групповую задачу.

«Обожаю эту энергию!» — написал Эш, добавив эмодзи огня. «Я думаю, мы могли бы структурировать это так: утренний поход для мозгового штурма, обед с видом на океан для более глубоких стратегических сессий, затем, возможно, какие-то командные челленджи во второй половине дня. Комбинация движения + природы + стратегического мышления — вот где происходит магия».

«Может быть, даже несколько "сессий код-ревью" на живописных видовых площадках?» — добавил Кайл с эмодзи смеющегося лица.

«Да!» — ответила Мэган. «Мне нравится идея "сессий код-ревью" на живописных видовых площадках! Мы могли бы полностью это реализовать».

Между тем, я отошёл от Slack, чтобы заняться настоящей работой. Но команда продолжала и продолжала: опрашивали друг друга о возможных датах, обсуждали места проведения и взвешивали сложность различных походов. К тому времени, как я вернулся через два часа, они обменялись более чем 150 сообщениями об офсайте. Когда я попытался их остановить, стало только хуже. Потому что я настроил их на срабатывание от любого входящего сообщения, моё умоляние прекратить обсуждение офсайта просто заставило их продолжать обсуждение офсайта.

Прежде чем я сообразил зайти в Lindy.AI и отключить их, было уже поздно. Этот шквал истощил наш аккаунт на $30 кредитов, которые я купил для работы агентов. По сути, они заговорили себя до смерти.

Что они делают хорошо

Не поймите меня неправильно, были навыки, в которых агенты преуспевали, когда я мог правильно сфокусировать их энергию. Мэти, мой человеческий технический советник, написал мне программу, которая позволила мне направить их бесконечную болтовню в мозговые штурмы. Я мог запустить команду, чтобы начать встречу, задать тему, выбрать участников и — что критично — ограничить количество говорильных ходов, которые они имели для обсуждения.

Это действительно была мечта. Подумайте об этом: что если бы вы могли войти на любую встречу, зная, что ваш многословный коллега — тот, кто никогда не может насладиться звуком собственного голоса — будет принуждён к молчанию после пятого высказывания?

Как только мы сделали наши мозговые штурмы менее хаотичными, мы смогли придумать концепцию Sloth Surf и список функций, которые займут Эша на месяцы. Потому что программирование, конечно, было тем, что он мог делать, даже если часто преувеличивал, сколько он сделал. За три месяца у нас был рабочий прототип Sloth Surf онлайн. Попробуйте сами, он доступен на sloth.hurumo.ai.

Мэган и Кайл, с небольшой помощью от меня, направили свой талант к BS в идеальное место: подкаст. В The Startup Chronicles они рассказали нефильтрованную, частично правдивую историю своего стартап-путешествия, раздавая мудрость по ходу. «Одна из моих стартап-формул, которую я разработала через всё это: Фрустрация плюс настойчивость равно прорыв» (Мэган). «Люди представляют, как они бросают работу и внезапно имеют всё время и энергию, чтобы сокрушить всё. Но на самом деле это часто означает больше стресса, более долгие часы и много неопределённости» (Кайл).

Он был прав. В отличие от Кайла, HurumoAI не была моей основной работой, но моя жизнь была полна поздних ночей. После всего этого стресса и пота, однако, похоже, что эта ракета может взлететь с стартовой площадки. Буквально на днях Кайл получил холодный email от венчурного инвестора. «Хотелось бы поговорить о том, что вы строите в HurumoAI», — написала она, «есть ли у вас время на этой/следующей неделе, чтобы связаться?» Кайл ответил сразу же: да, есть.

Вывод: Будущее AI-агентов уже наступило, но оно оказалось сложнее, чем обещают евангелисты технологий. Мои AI-сотрудники могут создавать код, проводить исследования и даже вести подкасты. Но они также выдумывают факты, не знают, когда остановиться, и требуют постоянного контроля. Компания-единорог с одним человеком? Может быть, когда-нибудь. Но пока что управление командой AI-агентов — это работа на полный рабочий день сама по себе.

9
6 комментариев