Решение простое, ничего сверхъестественного. У нас получилось всего 180 стоп-слов из различных вариаций бренда, номеров телефонов, адресов и др. Написали python-скрипт, которым раз в месяц перед датой отчета вычищали из запросов брендовые ключи. Скрипт самый простой: подаем таблицу на вход, на выходе получаем такую же таблицу, но без бренда. Получилось уже неплохо, но точность была довольно низкая. Python проверял всего-навсего вхождения в строку по стоп-словам. Не распознавал опечатки, ошибки и другие подобные формы. Нестандартные брендовые ключи и ключи уровня “хард” практически не распознавались.
Серьезный подход!
1. Кейс крут по доскональности, но остаётся вопрос, нужна ли она настолько точной? Не проще было бы договориться с маркетологами о допустимой ошибке в бренде на уровне 1% трафика? Вряд ли там бы больше собралось.
2. "договорились о том, что на всех отчетах не будем учитывать брендовый трафик"
У вас так не на всех проектах?
1. Там больше погрешность. А инструмент теперь можно везде использовать
2. Не у всех клиентов так по разному пишут название бренда
Комментарий недоступен
Отличный пример из практики, спасибо.
"Данная статья в очередной раз доказывает, почему SEO-специалист должен хотя бы немного разбираться в Python"
Зачем? Программисту в любом случае виднее, как построить алгоритм. Аналитику нужно просто данные предоставить и задачу объяснить.
Не, понятно, что каждая дополнительная компетенция повышает ценность специалиста. Но универсальность — это угроза специализации. Есть и другое: чем больше ты умеешь, тем больше на тебя будут пытаться навесить за те же деньги.