Как ускорить чистку запросов в Key Collector в 10 и более раз не пропустив ни один «мусорный» запрос?

При разработке рекламы в Яндекс Директ с большим количеством ключевиков, огромную часть времени отнимают их чистка. Иногда десятки тысяч ключей приходится просматривать и минусовать, а это ну очень нудная и рутинная работа.

Как ускорить чистку запросов в Key Collector в 10 и более раз не пропустив ни один «мусорный» запрос?

У нас появилась острая необходимость повысить скорость разработки рекламы без потери качества. И в качестве объекта оптимизации мы выбрали именно чистку запросов, как, наверное, самый времязатратный процесс.

Проанализировав более 500 кампаний на поиске в различных нишах, мы обнаружили, что более 90% «мусорных» запросов можно убрать уже на этапе формирования кампаний, просто почистив три-пять самых высокочастотных запроса для каждого тематического направления. Зачастую было достаточно 2-3 запросов.

К чему мы пришли?

Вывод был очень прост, но до безобразия эффективен. Мы после формирования базовых запросов и сбора их частотности выбирали для каждого направления от 2 до 5 самых частотных и отличающихся формулировкой. Как правило, это запросы из 2-3 слов.

Далее, забивали в Key Collector эти ключи с использованием оператора "Кавычки", и дополнительно приклеивали любое из слов, уже находящихся в запросе, например, "строительство домов домов".

Теперь, запустив парсинг таких запросов, нам не приходилось ждать часами его окончания, буквально несколько минут и всё готово. На выходе получаем список запросов, в десятки, а то и сотни раз мЕньший в сравнении с парсингом всей семантики, а, значит, и время на чистку сокращается заметно.

Теперь по порядку...

Немного фактов про оператор «кавычки»

Оператор «Кавычки» фиксирует количество слов, а не сами фразы. Показ по запросам, содержащим фразу без дополнительных слов (https://yandex.ru/support/direct/keywords/symbols-and-operators.html).

Данные из справки Яндекс
Данные из справки Яндекс

То есть, если мы в сервисе WordStat запишем фразу в виде "слово1 слово2" («!купить диван»), то зафиксируется количество слов во фразе.

Данные Яндекс Wordstat
Данные Яндекс Wordstat

Если мы запишем фразу в виде "слово1 слово2 слово2", то запросы будет состоять из трёх слов и будут иметь вид: «слово1 слово2 + все возможные варианты слов, которые искали пользователи со словосочетанием «слово1 и слово2».

Например, "!купить диван диван". WordStat выдаст «купить диван +в», «купить диван Москва», «купить диван недорого», «купить угловой диван» и т.д.

Данные Яндекс Wordstat
Данные Яндекс Wordstat

Важно! При использовании кавычек, некоторые слова (например, местоимения) не попадают в выдачу.

Поэтому мы сформировали свой список «общих» минус-слов, которые в 99% подойдут для любой рекламной кампании в любой нише. В него входят:

  • слова, которые не показываются при использовании кавычек. Например, «это», «как» и др.
  • «некоммерческие» слова. Т.е. информационные фразы-маркеры, где пользователь явно не настроен на покупку. Например, «зачем», «отзывы», «характеристики», «плюсы», «минусы», «если», «или», «самому», и т.д.

Этот список можно скачать отсюда

Почему этот метод намного лучше классической чистки?

Очевидно, что спарсить и вычистить три-пять фраз намного быстрее, чем всю семантику. Это особенно ощутимо, когда в семантике тысячи и десятки тысяч запросов.

Давайте разберем на примере.

В семантике по ремонту стиральных машин 4 000 запросов (ремонт, сервис, все виды поломок, все марки и др.)

Проведём эксперимент: за сколько времени Key Collector спарсит 3 высокочастотных запроса в кавычках, а за сколько – всю семантику по ремонту стиральных машин.

Три самых высокочастотных запроса по тематике ремонта стиральных машин. «Ремонт стиральной машины на дому» не учитываем, т.к. эта фраза уже входит в «Ремонт стиральной машины». Поэтому берем фразы про «ремонт», про «мастера» и про «сервис».
Три самых высокочастотных запроса по тематике ремонта стиральных машин. «Ремонт стиральной машины на дому» не учитываем, т.к. эта фраза уже входит в «Ремонт стиральной машины». Поэтому берем фразы про «ремонт», про «мастера» и про «сервис».

А теперь сравним прогнозируемое время парсинга.

<p>Парсинг трех высокочастотных запросов занял 4 минуты</p>

Парсинг трех высокочастотных запросов занял 4 минуты

Всего 4 минуты - и список для чистки готов. Вы даже чаю выпить не успеете, а уже пора продолжать.

Что же нам покажет вся семантика?

Парсинг всей семантики займёт примерно полтора дня
Парсинг всей семантики займёт примерно полтора дня

Полтора дня, Карл! Целых полтора дня ваш компьютер будет шуршать в поисках нового запроса.

И это еще далеко не самая широкая семантика. Представляете, что будет в "жирной" нише?

Очевидно, что метод с использованием "кавычек" значительно экономит как трудозатраты, так и конечное время на разработку. При этом, важно заметить, что при таком подходе вы не просто не теряете в эффективности и качестве формирования семантики и списка минусов, вы даже её повышаете.

Все мы знаем, что Wordstat показывает лишь 2000 фраз по запросу, очень часто этого недостаточно, поэтому приходится парсить вглубь. "Кавычки" позволяют даже для суперчастотных запросов получить фразы с частотностью вплоть до 1 показа. А это значит, что список минус-слов будет максимально полным, и показ объявлений будет осуществляться только целевой аудитории. Ну, конечно, не будем забывать и про значительную экономию бюджета за счет отсутствия кликов по нецелевым запросам.

Мы сами уже давно используем данный метод и чем дальше, тем больше убеждаемся в его супер удобстве и эффективности.

И напоследок

В данной статье мы решили не описывать полный алгоритм использования метода, но обещаем в ближайшее время выложить его, чтобы каждый смог оптимизировать свою работу.

Также в нашем арсенале есть ещё несколько полезных подходов к разработке и сопровождению рекламы, ими мы тоже как-нибудь поделимся.

1919
46 комментариев

Я могу подсказать, как ваш метод сделать ещё быстрее и еще эффективнее - используйте квадратные скобки и восклицательный знак вместе с ковычками! У вас "[!руки !из !жопы]", поэтому оставьте свои лайфхаки для внутреннего пользования.

4
Ответить
Автор

Максим, ваш комментарий нам понравился. Спасибо!
Теперь по существу:
1. У нас в статье нигде нет в кавычках квадратных скобок, но даже если бы и были, то это вполне нормально в некоторых случаях. Например, "билет [москва питер]". Ссылка на справку Яндекса есть в статье, ознакомьтесь внимательнее.
2. Кавычки, как мы и писали, фиксируют количество слов, но не порядок и словоформы. Поэтому восклицательный знак в кавычках совершенно органичен, если надо зафиксировать словоформу.
3. Нашими лайфхаками вы можете не пользоваться, т.к. они рассчитаны на аудиторию знающую и понимающую.

К сожалению, не каждый сможет воспользоваться нашими идеями. Но мы пошаговый алгоритм выложим в ближайшее время, возможно, ваше мнение поменяется.

4
Ответить

Спасибо за статью, попробуем. Редко увидишь что-то новое в старой теме)

3
Ответить

Идея то не плохая. Но я бы всё равно парсил отдельно всё чтобы сделать наиболее полный список минус-слов. А чтобы ускорить процесс нужно закупиться 10-20 проксями и аккаунтами директа.

1
Ответить
Автор

Павел, суть нашего метода как раз в том, что список минусов получается более полным, чем при классическом подходе.

Прокси и аккаунты если и ускорят процесс, то незначительно.

Плюс важный момент. Если очень глубоко парсить весь базис, может получится грязная семантика из многих сотен тысяч запросов, чистить их крайне муторно. В нашем случае даже в "жирных" нишах достаточно обработать несколько тысяч (может 10-15 максимум). Иначе говоря, объем парсинга и чистки уменьшается в десятки раз, а качество от этого не просто не страдает, а во многих случаях только улучшается.

Это не просто утверждение, мы проверяли.

Ответить

про минуса
кто-нибудь коллекционирует варианты написания слова WildBerries? :))
я каждый раз когда думаю что уже, все, буквы кончились и их возможные сочетания, они изобретают что-то новое.

Ответить
Автор

В нашей практике был случай с минусацией фразы "трейд ин".. Сколько вариаций мы не добавляли, всегда появлялись новые: трындын, тырым дым, тындын..

И это писали реальные люди...

1
Ответить