Голиаф — агент по управлению Яндекс Директ

Как за 40 дней агент по управлению Яндекс Директом потратил ~400 000 рублей бюджета, заработал 1 200 000 рублей выручки и показал ROAS 300%. Без ремаркетинга и без рекламы на поиске, по четырем разным воронкам.

Меня зовут Валерий Курземнек, я маркетинг-директор онлайн-университета Зерокодер и поделюсь кейсом. Кстати, буквально на днях я презентовал его на CPC Forum и рассказал, на каком объёме данных мы выстраивали правила принятия решений у Голиафа – больше цифр покажу в статье ниже.

19 июня презентовал кейс на CPC FORUM в Москве
19 июня презентовал кейс на CPC FORUM в Москве

Подрядчики

У нас в Зерокодере есть пул проверенных подрядчиков, с которыми мы работаем уже более 3 лет. Но подключать и находить новых – это очень больно и дорого.

• Дорогой онбординг. Даже с хорошими брифами и наработанными связками – в трафике дело может просто не пойти. А для бизнеса, оплата работы контекстолога это его ЗП и бюджет.

• Скорость. Онбординг долгий. Даже если есть аналитика, брифы, мидлы для трекинга.

• Реакция. Если есть апдейт в бизнесе – убрали воронку или продукт, есть задержка по изменениям в РК. Пока подрядчики узнают об этом, пока дойдут до кабинета. А если это агентство – появляется дополнительный этап, где нужно передать задачу специалистам. Да, ИИшка тоже может быть не в курсе пока ты сам ей не сообщишь, но это можно сделать сразу в терминал и апдейт вносится сразу.

Голиаф – это не замена исполнителей. А масштабирование источника, без прямого увеличения штата или подрядов.

Нюанс

Безусловно, любой сеньорный контекстолог + хороший дизайнер сделают лучше креативы и настройку кампаний. А если у них ещё будет хороший аналитик + хед аквизишн, то вообще на несколько голов лучше конечный результат.

Правда, моя гипотеза – Голиаф на средней дистанции все равно всех обгонит. Это сейчас как раз и тестируется – у нас параллельно работает инфраструктура “человеческая” и агентская.

По операционным затратам и скорости агентская инфраструктура уже выигрывает. Открытый вопрос — насколько она масштабируется с ростом рекламного бюджета и какой может быть цена ошибки.

Ключевая философия, из-под которой я предлагаю смотреть кейс: агент не экономит время – агент принимает решение за деньги.

Как это работает

Типичный запрос к агенту. Все внутренние названия проектов не выдуманы!
Типичный запрос к агенту. Все внутренние названия проектов не выдуманы!

В CMD я даю команду агенту собрать статистику и подготовить новые гипотезы. Он аргументированно приносит мне список на апрув. Аргументированно – значит на основе цифр и фактов, которые взяты из нашей БД и транскрибации звонков ОП. То есть, агент не должен опираться только на собственные предположения: каждая гипотеза сопровождается данными.

Да, он пока не сразу идёт и править и настраивать кампании – у нас вторая фаза тестирования, потому что нужно отслеживать галлюцинации и править процесс. Но сам факт – он идёт смотреть аналитику, находит сегменты, упаковывает их под настройку по API директа, делает креативы, тексты, собирает ключи и сетапит кампании.

На уровне объявлений, кстати, галлюцинаций меньше всего.

Все управление происходит через окошко терминала. Ставится задача (готовь кампании по Х продукту) и агент аргументированно приносит фактуру для запуска.

Что под капотом

Внезапно, это 2 агента. Потому что в одного это не влезло – слишком много галлюцинаций и слишком долго и дорого по токенам.

Один агент – аналитик (у него греческое имя Аякс, такая традиция у нас брать или библейские или греческие имена). Он знает наших клиентов (транскрибация звонков) и соотносит их с каждой воронкой. Все воронки и движение трафика у него замаплены (всё описано и посчитано). Он знает ARPL (выручка на 1 лид) по каждой воронке.

Это кстати было наилучшее решение. Раз в месяц готовится дамп нашей БД с новой когортой, которая достраивается в общую логику и калибрует портрет клиентов. Иначе – при каждом запуске или подсчете статистики – агент часами гонял бы запросы к БД и действовал очень медленно. Как она организована – будет ниже.

Второй агент, Голиаф, хорошо знает Яндекс Директ. Как работает API, как работают якорные интересы по ключам ЕПК, какие объявления у нас исторически лучше всего работают. Где можно делать эксперименты, а где нет. Как считать аналитику и принимать решения об остановке или продлении кампаний.

Всё это – чисто Claude, Опус 4.8, и яндексовское облако. Облако в схеме нужно, чтобы делать скрининг статистики за сутки. Простой питон скрипт, не привязанный к рабочей сессии с ллмкой. Чтобы Голиаф видел не только накопительную стату, но и то как она меняется из дня в день.

Кстати про стоимость. За 40 дней Голиаф и аналитик съели 70млн токенов. В долларах это 500$, спокойно влезло в подписку за 200$, так что по факту 200$. Плюс облако яндекса в районе 8тыс. рублей. И где-то 30-50$ на API для генерации баннеров.

Суммарно все удовольствие, без бюджета на трафик и моих рабочих часов – ~30тыс рублей.

Как агент принимает решение

Obsidian vault агентов
Obsidian vault агентов

Вся карта движения трафика, показатели и аватары клиентов – зашиты в локальный Обсидиан по Karpathy LLM wiki. По идее можно обойтись и без него, замапить без Обсидиана, но по моим наблюдениям LLM чутка лучше соображает и реже галлюцинирует.

Если "на пальцах", то благодаря этому фреймворку работы с данными – агент быстро может найти конкретное слово, в конкретном предложении, в конкретной книге, которая стоит на конкретной полке. Без заходов - “дай как я свежим взглядом пробегусь по всем отчетам и снова все посмотрю”. Кто использовал агентов для data driven – знает, что на больших объемах появляются галлюцинации.

Кстати пофиксить это можно разделив продакшн на стадии, но об этом не будем говорить в этом кейсе, чтобы не душить.

У агента есть «якорные правила». Все, кто работает с платной рекламой, знают тот самый момент: «может, ещё погреем, мб обучится?». Я засетапил 3 основных правила, которыми готов поделиться.

Первое – если 7 дней без лидов, то кампания останавливается.

Второе – если мы потратили 3xARPL и получили ноль лидов с объявления, то останавливаем объявление.

Третье – если стоимость КЭВ (квал. этап воронки, у нас это заказ для ОП) х1,7 от модельных или исторических данных, то кампания останавливается.

Эти 3 ключевых правила – основа. Та самая рамка, которую необходимо задать агенту, чтобы он не тупил. Кстати, опытные читатели поймут, что логика 1 в 1 как если управлять подрядчиками или исполнителями – им также задаётся рамка по принятию решений.

Data driven маркетинг на коленке

Крутая штука, даже если вы не захотите автоматизировать директ. Чем больше контекста про проект мы даем – тем лучше работает агент. Я брал чисто статистику по директу:

Пять рекламных кабинетов и статистика за 500 дней. Такой отрезок специально, потому что по лично моей оценке последние 500 дней мы хорошо переоформили в Директе. В целом клюшка в смарт ранкинге это подтверждает.

Зерокодер на SmartRanking
Зерокодер на SmartRanking

Это 150 млн маркетингового бюджета, которые мы потратили за этот срок.

Это более 200 «входов в нашу воронку» (вебинары, интенсивы и тп.), под 4 тыс. объявлений разной детализации (статика, заголовки, видео и тп.).

И всё это стало возможно благодаря нашему CTO Евгении. Она заранее настроила сохранение необходимых данных в БД

Чем больше данных мы можем дать на анализ, и чем лучше они прописаны в БД – тем точнее будет принимать решения агент. С кучей нюансов, куда без этого – данные должны быть по той же целевой аудитории и похожим продуктам, в одном источнике и тп.

Чем больше шума – тем хуже историческое обоснование для принятия решения агентом. Потому что данные между источниками – часто не переносятся друг на друга (стата по ЦА и их поведенческие факторы внутри воронки из посевов для директа, например).

Почему тут нет ссылки на оффер «купите Голиафа за 500р в месяц сегодня»

Потому что, технически, такую систему уже может собрать маркетолог с высокой компьютерной грамотностью. Но качество результата будет зависеть не столько от модели, сколько от данных, аналитической инфраструктуры и правил контроля.

С развитием моделей технический порог будет снижаться, но бизнес-контекст и ответственность за денежные решения никуда не исчезнут.

Где я наступил на грабли

На самом деле – много стоп-факторов было на уровне маппинга БД, потому что она старая, форматы записей несколько раз менялись, а аналитиком я никогда не был. Но это больше наш внутренний кейс, которые слабо применим к другим компаниям, по этому я поделюсь “подводными камнями”, которые будут полезны вам:

• Тот самый ROAS. 300% это «грязными». Я не поставил минусацию базы, которая у нас сейчас идёт по воронке. Причина простая – я про неё забыл. Обычный человеческий фактор – сам я тыщу лет уже не работал глубоко с Директом, не грузил аудитории. Но во второй стадии теста это появилось.

Это важно, потому что в целом закупку трафика мы трекаем по уникам. Плюс ретеншн для общей экономики – вторичная метрика, мы её тоже считаем. Но да, сам факт.

• UTM-правила. Хорошая новость – агент подкинул пару идей, как хорошо задизайнить ютмки с учётом комбинированных объявлений. Плохая – это сломало логику трекинга, которая у нас уже была выстроена в маркетинге. С этим пришлось повозиться, ибо агент раз 5 «забывал» про правильные ютмки.

• Креативы. Я тестировал банану + HTML-вёрстку. То есть банана генерит фоновую пикчу, а сверху накладывается HTML-ка. Но я так и не смог сделать, чтобы это было органично. Все время были перекрытия фоновых элементов, из-за чего креативы были слабые. Хорошо, что вышла ChatGPT Images 2.0, которая генерирует кириллицу без артефактов, – это решило задачу по генерации креативов.

• Ресайзы. Для Директа в идеале сейчас бы докидывать ресайзы по ЕПК-кампаниям. У меня не получилось сделать нормальную генерацию под нужные размеры и нормально их грузить по API. Постоянно или не похожие друг на друга визуалы, или они некорректно грузятся в кабинете. Глобально, это не критично, но сколько-то процентов эффективности мы не дотянули, есть над чем поработать.

• Ключи для ЕПК всё ещё нужно проверять. Тут я использовал связку с Топвизором (API вордстата у меня нет, да и под тест – слишком долго его получить) – агент собирает «якорные» ключи под нужные сегменты и ставит их в РК. Но этот аспект настройки всё ещё нужно перепроверять. Получаются или слишком «общие» ключи, или слишком сложные и узкие.

Полный продакшн фиксится хорошо через стадии + критика-приемщика (иначе вы становитесь QA в своем продукте, а это путь к алкоголизму), но уши все еще торчат.

Итог

1 200 000 рублей за 400 000 рублей бюджета. Атрибутированный ROAS составил 300%. Если исключить повторные касания с текущей базой и оставить только уникальных покупателей, оценка снижается примерно до 220%.

В целом, Голиаф — не про то, что ИИ заменит маркетолога, контекстолога или другого специалиста. Он про то, что один маркетолог с нормальной AI инфрой получает нечестное преимущество над другими. А такой винкондишн странно было бы упускать.

Хотя бы потому что на разработку Аякса + Голиафа я потратил 40~ часов рабочего времени в итоге и до этого никогда не делал агентов вообще.

P.S. Вот тут по канону должна быть ссылка «подпишись на мой телеграм». Ссылку не дам – после того как я только что объяснил, почему оффера тут нет, кнопка смотрелась бы совсем уж комично. Но если интересно – свои наработки я разбираю в телеграм-канале «Четвёртый маркетолог». Канал открытый, найдёте поиском в телеграме.

21
2