Голиаф — агент по управлению Яндекс Директ

Как за 40 дней агент по управлению Яндекс Директом потратил ~400 000 рублей бюджета, заработал 1 200 000 рублей выручки и показал ROAS 300%. Без ремаркетинга и без рекламы на поиске, по четырем разным воронкам.

Меня зовут Валерий Курземнек, я маркетинг-директор онлайн-университета Зерокодер и поделюсь кейсом. Кстати, буквально на днях я презентовал его на CPC Forum и рассказал, на каком объёме данных мы выстраивали правила принятия решений у Голиафа – больше цифр покажу в статье ниже.

19 июня презентовал кейс на CPC FORUM в Москве

У нас в Зерокодере есть пул проверенных подрядчиков, с которыми мы работаем уже более 3 лет. Но подключать и находить новых – это очень больно и дорого.

• Дорогой онбординг. Даже с хорошими брифами и наработанными связками – в трафике дело может просто не пойти. А для бизнеса, оплата работы контекстолога это его ЗП и бюджет.

• Скорость. Онбординг долгий. Даже если есть аналитика, брифы, мидлы для трекинга.

• Реакция. Если есть апдейт в бизнесе – убрали воронку или продукт, есть задержка по изменениям в РК. Пока подрядчики узнают об этом, пока дойдут до кабинета. А если это агентство – появляется дополнительный этап, где нужно передать задачу специалистам. Да, ИИшка тоже может быть не в курсе пока ты сам ей не сообщишь, но это можно сделать сразу в терминал и апдейт вносится сразу.

Голиаф – это не замена исполнителей. А масштабирование источника, без прямого увеличения штата или подрядов.

Безусловно, любой сеньорный контекстолог + хороший дизайнер сделают лучше креативы и настройку кампаний. А если у них ещё будет хороший аналитик + хед аквизишн, то вообще на несколько голов лучше конечный результат.

Правда, моя гипотеза – Голиаф на средней дистанции все равно всех обгонит. Это сейчас как раз и тестируется – у нас параллельно работает инфраструктура “человеческая” и агентская.

По операционным затратам и скорости агентская инфраструктура уже выигрывает. Открытый вопрос — насколько она масштабируется с ростом рекламного бюджета и какой может быть цена ошибки.

Ключевая философия, из-под которой я предлагаю смотреть кейс: агент не экономит время – агент принимает решение за деньги.

Типичный запрос к агенту. Все внутренние названия проектов не выдуманы!

В CMD я даю команду агенту собрать статистику и подготовить новые гипотезы. Он аргументированно приносит мне список на апрув. Аргументированно – значит на основе цифр и фактов, которые взяты из нашей БД и транскрибации звонков ОП. То есть, агент не должен опираться только на собственные предположения: каждая гипотеза сопровождается данными.

Да, он пока не сразу идёт и править и настраивать кампании – у нас вторая фаза тестирования, потому что нужно отслеживать галлюцинации и править процесс. Но сам факт – он идёт смотреть аналитику, находит сегменты, упаковывает их под настройку по API директа, делает креативы, тексты, собирает ключи и сетапит кампании.

На уровне объявлений, кстати, галлюцинаций меньше всего.

Все управление происходит через окошко терминала. Ставится задача (готовь кампании по Х продукту) и агент аргументированно приносит фактуру для запуска.

Внезапно, это 2 агента. Потому что в одного это не влезло – слишком много галлюцинаций и слишком долго и дорого по токенам.

Один агент – аналитик (у него греческое имя Аякс, такая традиция у нас брать или библейские или греческие имена). Он знает наших клиентов (транскрибация звонков) и соотносит их с каждой воронкой. Все воронки и движение трафика у него замаплены (всё описано и посчитано). Он знает ARPL (выручка на 1 лид) по каждой воронке.

Это кстати было наилучшее решение. Раз в месяц готовится дамп нашей БД с новой когортой, которая достраивается в общую логику и калибрует портрет клиентов. Иначе – при каждом запуске или подсчете статистики – агент часами гонял бы запросы к БД и действовал очень медленно. Как она организована – будет ниже.

Второй агент, Голиаф, хорошо знает Яндекс Директ. Как работает API, как работают якорные интересы по ключам ЕПК, какие объявления у нас исторически лучше всего работают. Где можно делать эксперименты, а где нет. Как считать аналитику и принимать решения об остановке или продлении кампаний.

Всё это – чисто Claude, Опус 4.8, и яндексовское облако. Облако в схеме нужно, чтобы делать скрининг статистики за сутки. Простой питон скрипт, не привязанный к рабочей сессии с ллмкой. Чтобы Голиаф видел не только накопительную стату, но и то как она меняется из дня в день.

Кстати про стоимость. За 40 дней Голиаф и аналитик съели 70млн токенов. В долларах это 500$, спокойно влезло в подписку за 200$, так что по факту 200$. Плюс облако яндекса в районе 8тыс. рублей. И где-то 30-50$ на API для генерации баннеров.

Суммарно все удовольствие, без бюджета на трафик и моих рабочих часов – ~30тыс рублей.

Вся карта движения трафика, показатели и аватары клиентов – зашиты в локальный Обсидиан по Karpathy LLM wiki. По идее можно обойтись и без него, замапить без Обсидиана, но по моим наблюдениям LLM чутка лучше соображает и реже галлюцинирует.

Если "на пальцах", то благодаря этому фреймворку работы с данными – агент быстро может найти конкретное слово, в конкретном предложении, в конкретной книге, которая стоит на конкретной полке. Без заходов - “дай как я свежим взглядом пробегусь по всем отчетам и снова все посмотрю”. Кто использовал агентов для data driven – знает, что на больших объемах появляются галлюцинации.

Кстати пофиксить это можно разделив продакшн на стадии, но об этом не будем говорить в этом кейсе, чтобы не душить.

У агента есть «якорные правила». Все, кто работает с платной рекламой, знают тот самый момент: «может, ещё погреем, мб обучится?». Я засетапил 3 основных правила, которыми готов поделиться.

Первое – если 7 дней без лидов, то кампания останавливается.

Второе – если мы потратили 3xARPL и получили ноль лидов с объявления, то останавливаем объявление.

Третье – если стоимость КЭВ (квал. этап воронки, у нас это заказ для ОП) х1,7 от модельных или исторических данных, то кампания останавливается.

Эти 3 ключевых правила – основа. Та самая рамка, которую необходимо задать агенту, чтобы он не тупил. Кстати, опытные читатели поймут, что логика 1 в 1 как если управлять подрядчиками или исполнителями – им также задаётся рамка по принятию решений.

Крутая штука, даже если вы не захотите автоматизировать директ. Чем больше контекста про проект мы даем – тем лучше работает агент. Я брал чисто статистику по директу:

Пять рекламных кабинетов и статистика за 500 дней. Такой отрезок специально, потому что по лично моей оценке последние 500 дней мы хорошо переоформили в Директе. В целом клюшка в смарт ранкинге это подтверждает.

Это 150 млн маркетингового бюджета, которые мы потратили за этот срок.

Это более 200 «входов в нашу воронку» (вебинары, интенсивы и тп.), под 4 тыс. объявлений разной детализации (статика, заголовки, видео и тп.).

И всё это стало возможно благодаря нашему CTO Евгении. Она заранее настроила сохранение необходимых данных в БД

Чем больше данных мы можем дать на анализ, и чем лучше они прописаны в БД – тем точнее будет принимать решения агент. С кучей нюансов, куда без этого – данные должны быть по той же целевой аудитории и похожим продуктам, в одном источнике и тп.

Чем больше шума – тем хуже историческое обоснование для принятия решения агентом. Потому что данные между источниками – часто не переносятся друг на друга (стата по ЦА и их поведенческие факторы внутри воронки из посевов для директа, например).

Потому что, технически, такую систему уже может собрать маркетолог с высокой компьютерной грамотностью. Но качество результата будет зависеть не столько от модели, сколько от данных, аналитической инфраструктуры и правил контроля.

С развитием моделей технический порог будет снижаться, но бизнес-контекст и ответственность за денежные решения никуда не исчезнут.

На самом деле – много стоп-факторов было на уровне маппинга БД, потому что она старая, форматы записей несколько раз менялись, а аналитиком я никогда не был. Но это больше наш внутренний кейс, которые слабо применим к другим компаниям, по этому я поделюсь “подводными камнями”, которые будут полезны вам:

• Тот самый ROAS. 300% это «грязными». Я не поставил минусацию базы, которая у нас сейчас идёт по воронке. Причина простая – я про неё забыл. Обычный человеческий фактор – сам я тыщу лет уже не работал глубоко с Директом, не грузил аудитории. Но во второй стадии теста это появилось.

Это важно, потому что в целом закупку трафика мы трекаем по уникам. Плюс ретеншн для общей экономики – вторичная метрика, мы её тоже считаем. Но да, сам факт.

• UTM-правила. Хорошая новость – агент подкинул пару идей, как хорошо задизайнить ютмки с учётом комбинированных объявлений. Плохая – это сломало логику трекинга, которая у нас уже была выстроена в маркетинге. С этим пришлось повозиться, ибо агент раз 5 «забывал» про правильные ютмки.

• Креативы. Я тестировал банану + HTML-вёрстку. То есть банана генерит фоновую пикчу, а сверху накладывается HTML-ка. Но я так и не смог сделать, чтобы это было органично. Все время были перекрытия фоновых элементов, из-за чего креативы были слабые. Хорошо, что вышла ChatGPT Images 2.0, которая генерирует кириллицу без артефактов, – это решило задачу по генерации креативов.

• Ресайзы. Для Директа в идеале сейчас бы докидывать ресайзы по ЕПК-кампаниям. У меня не получилось сделать нормальную генерацию под нужные размеры и нормально их грузить по API. Постоянно или не похожие друг на друга визуалы, или они некорректно грузятся в кабинете. Глобально, это не критично, но сколько-то процентов эффективности мы не дотянули, есть над чем поработать.

• Ключи для ЕПК всё ещё нужно проверять. Тут я использовал связку с Топвизором (API вордстата у меня нет, да и под тест – слишком долго его получить) – агент собирает «якорные» ключи под нужные сегменты и ставит их в РК. Но этот аспект настройки всё ещё нужно перепроверять. Получаются или слишком «общие» ключи, или слишком сложные и узкие.

Полный продакшн фиксится хорошо через стадии + критика-приемщика (иначе вы становитесь QA в своем продукте, а это путь к алкоголизму), но уши все еще торчат.

1 200 000 рублей за 400 000 рублей бюджета. Атрибутированный ROAS составил 300%. Если исключить повторные касания с текущей базой и оставить только уникальных покупателей, оценка снижается примерно до 220%.

В целом, Голиаф — не про то, что ИИ заменит маркетолога, контекстолога или другого специалиста. Он про то, что один маркетолог с нормальной AI инфрой получает нечестное преимущество над другими. А такой винкондишн странно было бы упускать.

Хотя бы потому что на разработку Аякса + Голиафа я потратил 40~ часов рабочего времени в итоге и до этого никогда не делал агентов вообще.

P.S. Вот тут по канону должна быть ссылка «подпишись на мой телеграм». Ссылку не дам – после того как я только что объяснил, почему оффера тут нет, кнопка смотрелась бы совсем уж комично. Но если интересно – свои наработки я разбираю в телеграм-канале «Четвёртый маркетолог». Канал открытый, найдёте поиском в телеграме.

Голиаф — агент по управлению Яндекс Директ

Подрядчики

Нюанс

Как это работает

Что под капотом

Как агент принимает решение

Data driven маркетинг на коленке

Почему тут нет ссылки на оффер «купите Голиафа за 500р в месяц сегодня»

Где я наступил на грабли

Итог