Как мы защищаем от скликивания рекламы «Яндекс.Директа», используя машинное обучение

Меня зовут Максим Кульгин, моя компания Clickfraud занимается защитой от скликивания контекстной рекламы в «Яндекс.Директе» и Google Ads. Расскажем довольно подробно нашу методику обнаружения кликающих ботов и подход к реализации защиты, которую вы можете реализовать и на своем сайте полностью или частично.

2828

Если кратко, то они предлагают использовать многомерную модель определения бот / не бот с вероятностью - и где-то в середине нейросеть, которая раздает "веса" различным параметрам визита + захватывает придуманные ими параметры визита (ну там движения мыши отследить, паттерн посещения страниц и т.д. - это некоторые из моих предположений. По идее корреляцию можно найти везде. Сорян, что сильно упростил)

Но основная проблема не в программистах, а в данных от Яндекса получаемых и в данных к Яндексу отправляемых.

Ты из каждой сессии получаешь ClientID, можешь как угодно их сегментировать, как угодно эти данные интерпретировать, но. Собрал ты сегменты условного кликфрода, а дальше что?

Обратно на Директ можно повлиять только путем корректировок через LAL аудитории.

Кто когда-нибудь собирал такие аудитории, прекрасно знает, во что это может вылиться. Даже если система защиты внутри ( in vitro) работает отменно, ничто не гарантирует, что бот не окажется больше похожим на потенциального покупателя, чем потенциальный покупатель сам на себя.

Единственное отличие бота от человека - боты не покупают. Но они могут вести себя как самые надёжные потенциальные покупатели с некоторой степенью рандомизации.

On the Dark side сидят такие же талантливые ребята со знанием методов k-средних и самообучаемых нейросетей - и изучают поведение покупателей с сегментацией по ЦА, типам сайтов и ниш. И знаете что? Им проще.

2

хороший склик стоит довольно дорого. и если работают профи - защиты нет. но не может стоимость заказа склика быть больше стоимости рекламы (для конкурента). поэтому чаще скликивают не профессионалы.

движение мыши - это следующий этап, который кстати позволяет довольно точно определить бота, т.к. эмуляция на сайте движения мышкой так, как это делают люди - очень сложная задача. поэтому у бота чаще движения рваные. в то время как люди на конкретном сайте двигают мышкой определенным образом (по шаблонам). но бот этого не знает ...