Anthropic запустила managed agents. Зачем, если агент с первого раза выдаёт 10% результата?

8 апреля Anthropic запустила Claude Managed Agents. Инфраструктура для AI-агентов: хостинг, мониторинг, песочница, масштабирование. Не нужно ничего разворачивать, агент работает в облаке Anthropic. Ранние клиенты: Notion, Rakuten, Asana.

Критика прилетела моментально: маркетинговая обёртка, реальной проблемы не решает. Мол, инфраструктура, это 20% боли. Остальные 80%, это то, что агент с первого прогона выдаёт мусор.

Я использую Claude Cowork и еще с десяток AI-агентов каждый день (мой утренний скаут мониторит 50+ источников автоматически). Расскажу, как вижу это изнутри.

Критика справедлива наполовину

Агент с первого прогона действительно даёт процентов 10-15 от нужного результата. Это правда, которую мало кто проговаривает вслух. Маркетинг говорит "настрой и забудь". Реальность: настрой, посмотри результат, скажи что не так, перезапусти, подправь промпт, снова посмотри. И так несколько итераций.

Мой скаут заработал нормально на пятой-шестой. Первые запуски выдавали либо банальщину, либо непроверенные факты, либо попадали мимо аудитории. Каждый день я корректировал: добавлял критерии отбора, уточнял формат, записывал ошибки в файл фейлов, чтобы агент не повторял их. Постепенно стало лучше.

Так что критики правы: если вам продают "AI-агент решит всё сам", вас обманывают. Агент, это быстрый стажёр. Толковый, но стажёр. Без вашей экспертизы он генерирует уверенную ерунду.

Но вывод "managed не нужны" не следует из посылки

Вот где критика сыпется. Люди путают два слоя:

Слой 1: инфраструктура. Как запустить агента так, чтобы он работал часами, не падал, логировал, масштабировался и не требовал инженера с DevOps-опытом.

Слой 2: качество результата. Как сделать так, чтобы агент выдавал то, что нужно, а не то, что похоже на нужное.

Managed agents решают первый слой. Критики требуют решения второго. Это как ругать AWS за то, что серверы не пишут код. Ну да, не пишут. Но без них код некуда деплоить.

Для компании в 30 человек без штатного инженера managed agents, это не плохой способ запустить агента в продакшн. Альтернатива: нанять инженера, который поднимет инфру. Или не запускать.

Три способа доводки: 10% → 90%

Настоящий вопрос не "managed vs custom". Настоящий вопрос: кто доводит результат агента с начальных 10% до рабочих 90%?

Вручную. Вы сами проверяете каждый результат, корректируете, перезапускаете. Работает, если агентов мало и вы эксперт в задаче. Не масштабируется: 3 агента ещё потянете, 20 уже нет.

Сам агент через итерации. Агент получает обратную связь, пересматривает результат, проверяет себя. Agent SDK от Anthropic идёт в эту сторону. На типовых задачах работает. На нестандартных пока слабо.

Гибрид. Агент делает 70%, человек корректирует 30%. Это мой способ. Агент генерирует утренний брифинг, я задаю направление, агент дорабатывает. За три недели качество выросло сильно, потому что каждая моя правка записывается в систему (промпт, SKILL.md, файлы контекста) и влияет на следующие запуски.

По оценкам ML6 (консалтинг, специализация на AI-агентах), кастомная разработка обходится в 2-3x дороже managed. Для бизнеса 10-200 человек разница может быть $50-150K в год. Цифра спорная (ML6 сами продают managed), но порядок правдоподобный: один ML-инженер в США стоит $120-170K/год.

Что делать конкретно

Если вы собственник бизнеса и думаете про AI-агентов:

Не начинайте с кастомной разработки. Начните с managed: Anthropic Managed Agents, Cowork, Bedrock AgentCore. Они снимут инфраструктурную боль. Вы сосредоточитесь на том, что managed не делает и не должен делать, на понимании задачи и доводке качества.

Закладывайте итерации. Агент заработает не сразу. Первая неделя, это настройка. Вторая, это отлавливание ошибок. К третьей начнёт выдавать что-то полезное. Если через три недели результат не устраивает, проблема в постановке задачи, не в инструменте.

Записывайте обратную связь. Каждая ваша правка должна куда-то сохраняться и влиять на следующие запуски. Без этой петли агент каждый день начинает с нуля. С петлёй, каждый день становится чуть лучше. Это самый большой рычаг.

Автоматизация без понимания, это хаос. Понимание без автоматизации, это бутылочное горлышко. Нужно и то, и то. Managed agents дают автоматизацию. Понимание остаётся за вами. Так и должно быть.

Больше разборов: t.me/gorilla_under_hood

2
Начать дискуссию