Лого vc.ru

​Антон Бут, Auditorius: О рынке RTB, programmatic-платформе и применении big data в рекламе

​Антон Бут, Auditorius: О рынке RTB, programmatic-платформе и применении big data в рекламе

Антон Бут, руководитель отдела данных компании Auditorius, занимающейся алгоритмическими закупками и обработкой данных, рассказал редактору Growth Hacks Данилю Хасаншину о технологиях RTB, programmatic-платформе, и о рынке больших данных в рекламной индустрии.

Поделиться

Антон Бут

Даниль Хасаншин: Раньше технологию называли RTB, что вызывало серьезную путаницу, а теперь для простоты используется термин «programmatic», и всем все понятно?

Антон Бут: Programmatic — это подход, концепция, суть которого заключается в автоматизации покупки интернет-рекламы. RTB (Real-Time Bidding) — термин, обозначающий протокол закупки интернет-рекламы по аукционному принципу. То есть покупка может происходить и не по аукционному принципу (например, по фиксированной цене напрямую на площадках), поэтому RTB — один из механизмов реализации programmatic, но сам по себе programmatic гораздо шире. В России этот рынок только развивается, тогда как на Западе он уже есть несколько лет.

Что представляет собой ваша компания, сколько человек в ней работает, и каковы ваши стратегические векторы?

В нашей компании порядка 50 человек, и мы сейчас достаточно быстро растем. Если выделять основные направления, которыми мы занимаемся, то это четыре продукта. Первый продукт можно назвать programmatic — агентство полного цикла: к нам приходят клиенты, мы для них полностью осуществляем programmatic-закупку уже как полноценное решение. Кроме того, мы выполняем агентские задачи: отчеты, договоры, аналитика, коммуникации с клиентами, иногда даже рисуем креативы, занимаемся оптимизацией — полноценный full-service.

Второй продукт — это платформа по обработке больших данных The Big History (tBh), представляющая собой систему глубокого анализа данных о пользователях без привязки к персональным данным. По сути, это анализ больших данных в интересах пользователя. После процедуры обработки данных мы получаем готовые сегменты с интересами пользователей. Всего в нашей таксономии более 170 готовых сегментов аудитории.

Третий проект — собственная programmatic-платформа. Версию для рекламных агентств планируем запустить в мае 2015 года. Это позволит любому агентству самостоятельно управлять programmatic-закупками, а в будущем будет и более простая версия для небольших прямых рекламодателей, которые предпочитают самостоятельно управлять рекламными кампаниями (self-service). Аналогов на российском рынке нет, и продукт уже работает, но находится в тестовом режиме: наши сотрудники осуществляют закупки внутренне, однако пока мы не открыты для рынка.

Помимо наших собственных данных в programmatic-платформе будут доступны готовые данные всех основных поставщиков рынка. Закупку можно будет осуществлять в одном месте, и, что очень важно для многих агентств, здесь же будет представлен весь необходимый интерфейс и статистика. Иными словами, игроку рынка не нужно будет в каждом отдельном месте сводить разную информацию, и будет возможность сразу скачать все необходимые отчеты в удобном формате для внутренних бизнес-процессов.

И четвертый проект, еще на стадии финального формирования как продукта (хотя уже есть клиенты) — это DMP для конечного рекламодателя (Data Management Platform — платформа для сбора и управления большими данными). Платформа позволит централизовано собирать, хранить и анализировать данные из различных разнородных источников как то: внутренние CRM клиентов, данные из социальных сетей и любых внешних онлайн- и офлайн-поставщиков данных. Это позволит бренду собирать данные о своих клиентах в одном месте и использовать для повышения эффективности маркетинговых активностей.

Откуда берутся большие данные? Я знаю, что есть какие-то прямые доступы к тому, что собирает, к примеру, Google. Но чтобы подключиться к этим данным, нужны такие мощности, что всего в мире существует 3-4 компании, которые готовы этот поток данных обрабатывать. Это сырые data. Как их вообще можно обрабатывать, учитывая такие объемы?

Да, источников сырых данных очень много. Мы не используем данные Google, других источников на рынке огромное количество. Фактически любая компания, любой сайт являются источником данных. Data — это история посещений определенных сайтов в интернете, история лайков и поисковых запросов. Эти сведения собираются при помощи плагинов, бесплатных счетчиков, которые ставятся на сайте. Данные могут продаваться поставщиками услуг, которые прямо видят весь трафик.

Поставщики услуг? Кто в данном случае этим занимается?

Например, Московская городская телефонная сеть или любой провайдер услуг. На Западе данные продают фактически все. Начиная от компании Expedia Travel, предоставляющей информацию о том, кто что покупает, кто куда летает, заканчивая страховыми компаниями — что и сколько покупает клиент, его платежеспособность и так далее. Но есть те, кто использует данные только в целях своей компании: «Яндекс», Mail.Ru и Google не торгуют данными.

Но Facebook торгует данными?

Нет, Facebook создал внутрикорпоративную рекламную платформу Atlas, которая, однако, позволяет сторонним сайтам изучать поведение пользователей. Она призвана помочь своему владельцу бороться с монополией компании Google на рынке контекстной рекламы. Но при этом Facebook не делится своими данными.

Как идет работа с поставщиками данных?

Рынок данных появился совсем недавно, еще два года назад такого понятия не существовало. Впервые об этом начали говорить на РИФе, затем появились компании, которые начали позиционировать себя игроками рынка данных. Следует отметить, что он до сих пор находится в стадии формирования, а мы являемся одной из тех компаний, которые формируют спрос на data.

Механизм работы следующий: поставщик предоставляет нам определенное количество данных. Что мы делаем? Мы смотрим, сколько у них данных — 2 или 10 млрд записей. Дальше анализируем, откуда приходят данные, что это за сайты, сколько у них пользователей. То есть мы смотрим на количество данных и охват — это первоочередные задачи. Дальше мы анализируем, насколько данные качественные, и что они могут рассказать о пользователе. Чтобы наши рекламодатели, приходя к нам, смогли выбрать нужную им целевую аудиторию, например, всех автомобилистов России.

А если подробнее о технологии?

Мы programmatic-платформа — мета-DSP (Demand-Side Platform — это технологичная платформа, которая представляет интересы рекламодателя в экосистеме RTB), к которой подключено несколько DSP. И мы работаем над оптимизацией всех данных, включая и то, в какой именно DSP на одной и той же площадке покупать показы креатива.

При покупке сырых данных мы получаем от разных поставщиков историю посещения сайтов, каждый пользователь получает идентификатор (ID). От одного поставщика мы видим, что посетитель заходил на 10 сайтов, еще от одного — на 105, таким образом, о каждом пользователе набираем некий объем информации.

Дальше мы проводим латентно-семантический анализ контента страницы, то есть определяем тематику каждой конкретной страницы. Мы узнаем, что человек посетил некое количество страниц, которые были посвящены определенным тематикам. У нас есть несколько тысяч категорий, одна или несколько из которых может быть присвоена конкретной странице. И вот с этой информацией уже можно работать. Чтобы узнать, насколько площадка и ее данные нам интересны, мы договариваемся о некоем тестовом периоде.

Поставщик не боится, что вы возьмете и присвоите всю базу данных за этот тестовый период?

Нет, у этих данных срок жизни сравнительно небольшой. Вот ты сегодня ходил на сайт про валюту?

Да, потому что это актуально сегодня.

А послезавтра уже нет смысла показывать эти данные, потому что тебя это больше не интересует. Срок актуальности информации зависит от тематики: в случае автомобильной — это несколько месяцев. Но обычно все ограничивается буквально несколькими днями, максимум десятью.

Помимо того, что сами категории очень разнятся, чем меньше времени назад ты ей интересовался, тем более релевантной будет твоя реклама. Поэтому если собирать и хранить долгую информацию, то половина пользователей будет во всех сегментах. Реклама в этом случае становится менее релевантной. Так как людей много, ресурсы и рекламодатели ограничены, то есть необходимость показать рекламное объявление только тем людям, которым это сейчас максимально интересно.

У нас хранятся все данные, но не все мы используем. Смотрим, какой объем data мы получили. Например, 3 млрд записей, оцениваем, сколько нам интересны на самом деле, что может заинтересовать рекламодателя. Мы оцениваем, какие нужны категории и насколько они интересны и ценны. И думаем, хотим мы за это платить или не хотим.

Есть платформа по обработке больших данных (DMP, о которой шла речь выше), сделанная на собственных технологиях, и programmatic-платформа, к которой подключено несколько DSP. Оба этих направления востребованы: с прошлого года бизнес вырос на порядок в плане объемов. И хотя мы только начинаем продавать свои данные на рынке, уже выстроилась очередь компаний, которые находятся в процессе интеграции. Мы понимаем, что есть огромная потребность в качественных данных.

Так, мы уже реализовали проект с гостиничным порталом HRS. Разделив потоки аудитории и разработав для каждого из них отдельные посадочные страницы, мы повысили общий прирост конверсий по итогам двух месяцев работы на 23% и сократили бюджет на продвижение в 2 раза.

Как вы продаете эту идею вашим клиентам?

Мы образовываем рынок. Наши основатели, Геннадий Нагорнов и Валерий Кашин, рассказывают о programmatic. Про термин RTB знают многие — теперь наша задача заключается в том, чтобы рассказать детально, что есть рынок данных, что представляют собой алгоритмические закупки и насколько глубоко можно таргетировать аудиторию.

Как отдельная компания, занимающаяся данными, существует tBh. Часто спрашивают о конфиденциальности данных. Мы не продаем данные клиента — first-party data — о визитах на сайт, действиях пользователя. Они существуют в отдельной базе данных и могут быть использованы только самим клиентом в его рекламных кампаниях. Для формирования аудиторных сегментов используются только данные, которые мы покупаем на легальной основе.

Пишете, что у вас охват 80% аудитории. Почему не меньше и не больше?

Если говорить про охват, 20% — это избыточные данные, о которых я говорил. 80% сполна покрывают все нужды рекламодателей.

Как идет определение более узких данных, например, пола? Так, «Яндекс» использует «Яндекс.Навигатор» диктофон. Какие еще есть варианты, какими вы пользуетесь?

Чтобы разделить аудиторию на категории, существует следующий алгоритм. Берется контрольная группа, про которую знаете, что она состоит, например, из мужчин (они заполнили анкетные данные в некой социальной сети). «Яндекс» получает такую информацию из «Яндекс.Почты»: люди при прохождении регистрации заполняют профиль и указывают пол.

Дальше начинается математика, которой занимаются наши специалисты по данным (data scientists). Изучается история поведения в интернете остальной массы ID: чем ох действия отличаются от поведения отобранной категории мужчин. В итоге у нас появляется некий алгоритм, по которому с некоторой вероятностью от 50 до 90% можно сказать, какого пола пользователь. Его можно применять к более тонким данным профилей, например, профессии или социальному статусу.

Можешь, например, признаки бота назвать какие-то? Как вы их отсекаете?

Количество посещений, время посещения сайта, IP адрес, движения «мышкой». Мы отслеживаем это. Например, используем анализ user agent, с их помощью узнаем, через какое устройство пользователь вышел в интернет. Другой способ — анализ cookies, срок жизни которых у ботов составляет менее суток. Мы фильтруем данные от ботов до того, как сформировать из них сегменты и предоставить их клиенту.

На ЦП есть интересная колонка «Атака ботов». В ней говорилось и о RTB, что это все одна история — заполонение ботами.

Этот текст к RTB не имеет никакого отношения. В статье описывается ситуация, когда идет покупка не по данным, а по местам размещения. Но если ты покупаешь не сайт, а конкретных людей, которые уже «очищены» от ботов, то клиент с ними не столкнется. Можно говорить, что если не хочешь, чтобы твою рекламу показывали боту — используй технологию programmatic и аудиторных закупок.

Популярные статьи
Показать еще
Комментарии отсортированы
как обычно по времени по популярности

"Этот текст к RTB не имеет никакого отношения. В статье описывается ситуация, когда идет покупка не по данным, а по местам размещения. Но если ты покупаешь не сайт, а конкретных людей, которые уже «очищены» от ботов, то клиент с ними не столкнется".

Да что вы говорите =) Как интересно =)

Вы говорите в паблике про способы отлова ботов, говорите.

Заодно расскажите про механизм генерации шаблонов поведения на сайте в R или в питоне на крайняк, подо что в нете валяются готовые библиотеки в том числе с псевдо-нейросетями. Про генерацию юзер-агентов расскажите. Про сбор кук с бесконечным объемов доменов и страниц простецким вебскрейпером, который элементарно "светится" пару недель по доменам, где висят SSP коды, а потом по чуть-чуть прокликивается. Расскажите еще про расширения для браузеров, которые вам дадут самые супер валидные данные, только в Яндекс-вебвизоре пустота или фейк.

Ну а потом еще раз расскажите все то же самое. Правда очень интересно будет послушать ваших клиентов, которые с восторгом рассказывают про адские конверсии которые Директ за пояс затыкивают как ценой так и объемом.

Ага, монстры онлайна не смогли ещё решить вопрос с ботами, а они смогли. Поздравляю, чё.

Но речь в статье, конечно, немного не о том. РТБ прикольные штуки с юзерами помогает проворачивать.

0

Иван, да вы Бог обмана) Какая глубина познаний в построении мошеннических схем! Круто! Видимо с минимальными издержками, зарабатываете огромные деньги и выходите уже на Nasdaq)

По вашей логике, если вы знаете кто у вас ворует и как то вы автоматом тоже вор.

ну оооок...

Как можно быть таким уверенным в чем-то? Если нет прямых доказательств - то это не более чем гипотеза.
Проблема есть в Мире. Люди с ней борятся. Кто-то честный, кто-то нет. Это жизнь и это бизнес.
У Аудиториуса есть как крутейшие по эффективности кейсы с лидами, так и провальные. У каждой компании есть такое в Мире. Это нормально.

Это все круто, конечно. А кейсы? Кейсы то где?-)

На slideshare и презах с конференций

"Мы не продаем данные клиента — first-party data — о визитах на сайт, действиях пользователя. Они существуют в отдельной базе данных и могут быть использованы только самим клиентом в его рекламных кампаниях."

ребят, это ж вообще детский сад для клиента-лоха) "отдельная база"
да и знает весь рынок кейс, когда чудным образом у вас брали данные и реклама по ним волшебно шла по посетителям сайта конкурента покупателя. неужто вам одного скандала мало, не считая тех что не вскрылись?

Реклама тут запрещена? Вобщем мы закупали размещение через "социальные гадания" - наверно так переводится)
Чуда не произошло - cpo по ласт клику был на 20% выше чем с контекста

Поподробней расскажите. Очень сумбурно вы написали.

0

Иван, вы в целом правы, что выцепить бота в момент показа рекламы только по одной записи и только по user agent + поведенческим факторам, крайне сложно, т.к. их достаточно легко подделать.

Но вот в истории про аудиторные сегменты, когда у нас есть ретроспективные данные о большом кол-ве визитов - тут получается очистить аудиторный сегмент от большинства ботов.

Конкретно работает комбинация анализа user agent (отсев легальных и тупых ботов), сроки жизни куки (менее одного дня с большой вероятностью бот) и кол-ва записей/время между визитами на разные страницы (условно, 1000 визитов в интервалом в 1 секунду), позволяет как-минимум на порядок снизить кол-во ботов, по которым будет впустую показываться реклама рекламодателя.

Относительно кейсов: зайдите в slideshare на аккаунт аудиториуса - там их много.

"Иван, вы в целом правы, что выцепить бота в момент показа рекламы только по одной записи и только по user agent + поведенческим факторам, крайне сложно, т.к. их достаточно легко подделать."

Я этого не говорил. Вы как не внимательно прочитали статью, так и не внимательно прочитали мой комментарий.

В двух словах: подделать перемещения, агентов, сроки, куки и пр. делать нефиг. Причем никогда вы не узнаете кто это делает сам вебмастер или сетка. Собрать нейросеть, которая отдерет ваш доморощенный биг-дата сейчас может головастый студент с уже готовыми опенсорсными либами.

Ну а вообще на западе консорциум с 2014 года на эту тему собирают. А у вас бэмс и нет ни ботов ни накруток, потому что вы смотрите на срок появления куки. Как все легко и просто =)

www.exchangewire.com/blog/2014/01/30/consortium-to-combat-click-fraud-mooted/

www.itbusiness.ca/news/more-than-half-of-real-time-bidding-involves-falsely-represented-inventory-clearstream/52955

Процитирую оттуда же. Особенно важен последний абзац:

"James Collier, UK MD of Experian-owned AdTruth, a company that helps verify the authenticity of an impression, especially on mobile, also claims the issue of online ad fraud and media exchanges are inextricably linked.

He adds: “There is a direct correlation between ‘bot traffic’ and adtech, and that’s largely because ‘bot traffic’ exists in the long tail [where many exchanges source their inventory]. We work with some exchanges to help them detect such activity, but it can be difficult because many of these ‘bots’ are incredibly intelligent.”

0

Иван, Антон читал интервью, это интервью с ним и есть :)

0

"Вы как не внимательно прочитали статью, так и не внимательно прочитали мой комментарий." вы это говорите участнику интервью, которое комментируете.

0

Я про статью "Атака ботов" говорил. Мне показалась очевидной разница между статьей и интервью.

Кто прочитал, можно краткий пересказ?

Возможность комментирования статьи доступна только в первые две недели после публикации.

Сейчас обсуждают
Андрей Суханов

Не только крупный бизнес двигается по "трендовым" мемам, но и мелочь за ними поспевает)
sweetbags.ru/news/vzhuh-jeto-kakaja-to-sumochnaja-magija

«Вжух»: реакция российских компаний на мем с котом и волшебной палочкой
0
Valentin Dombrovsky
Travelabs

Вы будете смеяться, но акками компаний, вероятней всего, рулят миллениалы.

«Вжух»: реакция российских компаний на мем с котом и волшебной палочкой
0
Valentin Dombrovsky
Travelabs

Северсталь -> ТУИ -> Утконос - казалось бы, странная передача "эстафеты"... Если не вспомнить, что это всё компании Мордашова.

«Вжух»: реакция российских компаний на мем с котом и волшебной палочкой
0
Дмитрий Красильников

разработчик mYgento это, конечно сильно.

Наиболее высокооплачиваемые ИТ-вакансии в городах России и Казахстана на сайте HeadHunter за ноябрь
0
Юлия Панецкая

Вы сделали мой день)

«Товарооборот на 44% превысил ожидания маркетологов»: история акции с «Прилипалами» в «Дикси»
0
Показать еще