Лого vc.ru

Рынок данных в России: Стоимость, поставщики, аудиторные сегменты

Рынок данных в России: Стоимость, поставщики, аудиторные сегменты

Programmatic buying — это автоматизированная покупка таргетированной рекламы для конкретных пользователей с учетом их интересов и потребностей на основе данных.

Основатель и генеральный директор платформы Hybrid Дмитрий Чеклов написал колонку о рынке данных в России — откуда они поступают, сколько стоят, на какие типы делятся и какие компании занимаются их получением и обработкой.

Поделиться
Основатель и генеральный директор платформы Hybrid Дмитрий Чеклов

Есть компании, которые поставляют данные, а есть те, которые их покупают. Я представляю интересы DSP — компании, покупающей эти данные и применяющей их в рекламных кампаниях. Посмотрим на тех, кто водится в нашем пруду.

Data Suppliers — это общее обозначение поставщиков данных. Их разделяют на две категории: тех, кто поставляет готовые аудиторные сегменты — Processed Data Suppliers, и тех, кто поставляет необработанные (или сырые) данные — Raw Data Suppliers. Процесс движения данных я попытался отобразить на картинке:

Забегая вперед, скажу, что DSP покупают не только готовые аудиторные сегменты. Многие из них умеют сами «готовить дату».

Raw Data Suppliers

В большинстве случаев такие компании продают историю посещений пользователем сайтов и страниц (кликстрим). Есть также информация о лайках, действиях «поделиться», анкетной информации пользователей (анонимной), но больше всего именно историй посещений сайтов.

Откуда компании берут данные о действиях в интернете:

  • Счетчики посещений (LiveInternet), социальные кнопки (например, Pluso), рекламные сети и SSP (платформы для веб-издателей, посредством которых рекламные сети или сайты продают свои рекламные площади — прим. ред.), онлайн-чаты, виджеты.
  • Плагины в браузерах.
  • Логи хостинг-провайдеров.
  • DPI интернет-провайдеров. Здесь стоит отметить, что идентификатором пользователя выступает домохозяйство, а в процессе обработки данных можно выделять отдельные браузеры. Это означает, что, если пользователь почистит cookies, информация о его посещениях всё равно останется у поставщика. На рынок попадает абсолютно всё касательно посещений сайтов по открытому HTTP-протоколу. При этом информация о платежах находится под защитой HTTPS-протокола, так что здесь нечего бояться.
  • Приложения и игры в социальных сетях. Пожалуй, это самая «серая» сторона рынка, которая передает данные в конвертах и не платит налоги. Причина здесь простая — угроза наложения санкций со стороны соцсетей. Рынок в этом случае получает данные о профиле пользователей — пол, возраст и так далее.
  • Мобильные операторы.

Таким образом, источники «сырых данных» разнообразны по способу извлечения информации, но всё это вполне законно, и пользователи вряд ли могут с этим что-то поделать. Однако, чтобы избежать репутационных рисков, но при этом не упустить выгоду, поставщики «сырой даты» скрываются за NDA.

Поэтому, когда вы спрашиваете у компании: «Откуда у вас данные?», самый распространённый ответ: «Мы не можем вам об этом сказать».

Стоимость сырых данных

Самая распространенная схема продажи такого ресурса — это покупка сразу всех данных за определенную абонентскую плату (100-500 тысяч рублей в месяц). Недостаток в том, что если закупать их сразу у нескольких поставщиков, то возможны пересечения.

Также в большинстве случаев вы не можете нацелиться на определенные сайты или применить другие фильтры на стороне поставщика. Поэтому основными покупателями в этом случае являются Processed Data Suppliers. Помимо рекламных игроков, такие данные покупают еще и аналитические сервисы.

Processed Data Suppliers

Эти компании закупают ресурс у поставщиков сырых данных, обрабатывают его и в дальнейшем получают аудиторные сегменты, наиболее востребованные у рекламодателей. Откуда они берут информацию, зачастую скрывается (как уже было сказано выше), хотя некоторых своих поставщиков они всё же обозначают.

Какие данные поставляют на рынок

У каждого игрока есть таксономия с аудиторными сегментами. По своему характеру они делятся на следующие типы: интересы, намерения, соцдем, офлайн-данные и биржа данных.

Интересы

Они определяются на основе истории посещений пользователем сайтов и другой информации. Примеры: «покупка авто», «покупка недвижимости», «животные». Обычно рекламодателей интересует более узкие сегменты: «покупка Ford», «покупка коммерческой недвижимости», «интересовался попугаями» — они также входят в таксономию аудиторных сегментов, если есть спрос со стороны рекламодателя. Самый распространённый способ их построения выглядит следующим образом:

Все страницы, посещаемые пользователем, индексируются на предмет содержания ключевых слов, отражающих определенную тематику. Каждый сайт и, если это возможно, его разделы тоже классифицируются по принадлежности к определённой тематике. Далее каждый сегмент в таксономии описывается либо ключевыми словами, либо тематикой сайта, частотой посещения.

Многие такие сегменты создаются при помощи машинного обучения, но принцип примерно такой же, только всё это происходит в автоматическом режиме.

Срок жизни интереса также имеет значение. Некоторые «живут» день, некоторые — два, а какие-то и месяцами могут существовать. Это важно, если поставщик заботится не только о вхождении пользователя в сегмент, но и о его удалении оттуда.

Всякий раз, когда мы говорим о покупке готовых аудиторных сегментов, стоить знать, что вы получите пользователей, которые с определённой вероятностью интересуются чем-либо. И не стоит задавать глупые вопросы, вроде этих: «А если пользователь зашел случайно, то что?» А ничего. Никакие технологии пока не могут со 100% точностью определить, чем же действительно интересуется человек.

Намерения

Это очень короткие по своему существованию аудиторные сегменты. Они отражают покупательские намерения. Например, пользователь хочет купить пылесос, одежду, взять в аренду авто, починить ноутбук.

Есть и такие, которые живут дольше — например, «хочет построить дом». В основном этими данными интересуются ecommerce-рекламодатели. Строятся такие сегменты аналогично предыдущим.

Соцдем

Этот вид данных — самый тяжело добываемый. Информацией о соцдеме в интернете владеют социальные сети, и они никогда не отдадут ее на рынок данных. Прежде чем отвечу на вопрос, как такие данные просачиваются на рынок, рассмотрим еще пару терминов — это точность и полнота.

Точность отражает качество аудиторного сегмента — то, с какой вероятностью пользователь действительно принадлежит к нему.

Полнота говорит о том, какой процент пользователей содержит аудиторный сегмент из всей аудитории интернета, которая могла бы принадлежать к нему. Например, у нас есть категория «играют на гитаре», и в ней содержится тысяча человек. Но на самом деле в интернете их сотни тысяч или миллионы, но мы не можем их обнаружить из-за недостатка открытых данных.

Возвращаясь к теме соцдема. На текущий момент почти все игроки владеют неполным набором таких данных. И если вы выбираете категорию «мужчины 25-30», будет хорошим результатом, если вы охватите 5% от всех пользователей, подходящих под эти параметры.

Откуда поставщики берут данные о соцдеме

Во-первых, они поступают от всевозможных сервисов, владеющих информацией от самих пользователей, в том числе из соцсетей — посредством серых схем, о которых я уже говорил выше. Купить 100% данных обо всей аудитории интернета просто невозможно.

Поэтому поставщики с помощью алгоритмов машинного обучения и истории посещения пользователя получают вычисляемые данные о соцдеме. Таким образом, снижается общая точность аудиторного сегмента, но повышается полнота. Опять же, разметить 100% пользователей просто на принадлежность группам мужчина/женщина с вероятностью более 70% тоже невозможно — полнота данных о возрасте даже с учетом применения machine learning-алгоритмов будет еще меньше.

Офлайн-данные

Они отражают действия пользователей вне интернета, например, о его покупках или счетах. Всё это, конечно, в обезличенном виде. В данном случае Processed Data Suppliers ничего не обрабатывают, а помогают обладателям данных выйти на рынок данных и монетизировать их. Новый тип игроков — Data Exchange.

Data Exchange

Это компании (очень часто ими выступают всё те же Processed Data Suppliers), которые предоставляют свою платформу для передачи данных конечным потребителям. Они нужны, например, DSP — для них это очень удобно, не нужно интегрироваться с каждым поставщиком, достаточно использовать отлаженные схемы.

Таким образом, Data Exchange позволяют через единое окно покупать и продавать данные. Если вы — обладатель «вкусной даты», то самый простой и быстрый способ выпустить их на рынок — это обратиться к этому игроку.

Офлайн-данных на сегодняшний день в свободной продаже нет, но тренд обозначен, и в ближайшей перспективе мы увидим ряд поставщиков, продающих подобную информацию. В основном это будут банки, мобильные операторы, крупные ритейлеры. Важный момент: все подряд не могут продавать эти данные, так как необходимо иметь результат взаимосвязи пользователя в офлайне и онлайне.

Например, банки могут связывать эту информацию через использование личного кабинета и мобильного приложения. Ритейлеры — через активацию карт лояльности. Мобильные операторы — через использование интернета.

Биржа данных

Я уже говорил, что с помощью Data Exchange информация может даже в необработанном виде поступать конечным потребителям вроде DSP. Приведу примеры того, у каких данных есть возможность оказаться на рынке: выступать поставщиком могут ecommerce-проекты, как это уже делают Amazon и eBay на Западе, профессиональные социальные сервисы, владеющие информацией о трудовой занятости и профессии пользователя.

Также информацию о пользователях могут поставлять сервисы по бронированию (поскольку знают о его путешествиях), по продаже билетов и так далее. Информации о пользователях в интернете очень много — окажутся ли подобные данные на рынке, зависит от политики игроков, которые ими владеют.

Стоимость готовых аудиторных сегментов

  • Абонентская плата за все сегменты: 300-500 тысяч рублей.
  • За тысячу показов: 10-50 рублей CPM.
  • За один профиль пользователя: 0,1-3 рубля за один профиль.
  • Revenue share — это когда поставщики данных получают часть выручки рекламной системы.

Идентификация пользователей

Практически каждая система и платформа имеет свой namespace пользователей, если речь идет об идентификации на основе cookies. И для того, чтобы данные из одной системы поступили в другую, необходимо проводить cookie-матчинг — это такая таблица соответствия идентификатора одной системы со всеми остальными. С развитием мобильных платформ в качестве идентификатора также могут выступать Device Id — в этом случае все системы оперируют одними и теми же идентификаторами.

Можно ли использовать данные от поставщиков в социальных сетях «ВКонтакте», «Одноклассники», Facebook

Как многие знают, российские социальные сервисы не выставляют свой трафик на RTB-биржи. Однако почти все эти данные можно закупать через платформу myTarget. Эта система позволяет технологическим платформам проводить одностороннюю синхронизацию данных в DMP myTarget. То есть вы можете проводить рекламные кампании на основе информации от поставщиков в «Одноклассниках», «Моем Мире» и «Вконтакте», если вы рекламируете мобильные приложения.

С Facebook дела обстоят так. Многие западные компании (их список ограничен) интегрированы с FBX. Это RTB-биржа социальной сети, поэтому использование сторонних данных возможно по умолчанию, но российских поставщиков данных вы вряд ли где-то найдете, да и неудобно с ними работать. Также в FBX отсутствует ряд форматов.

Другой способ работы с Facebook предполагает такую же схему интеграции, как и с российскими социальными сетями — через одностороннюю синхронизацию данных. Но для этого нужно обладать статусом маркетингового партнёра компании. В России им является aidata.me.

Как компании покупать рекламу с использованием данных

Покупать данные напрямую у поставщика и потом их использовать — дело, скорее, абсурдное, если вы не обладаете необходимой инфраструктурой. В таком случае рекламодателю необходимо обращаться в DSP или Trading Desk. Список таких компаний можно найти здесь. Однако не все из них владеют данными от всех поставщиков и возможностью проводить кампании в RTB и соцсетях. Я бы выделил следующие:

Какие компании продают данные

Список наиболее активных игроков в этом плане.

Статьи по теме
Участники российского рынка programmatic buying — о своих проектах, конкуренции и технологии29 апреля 2015, 20:19
​Антон Бут, Auditorius: О рынке RTB, programmatic-платформе и применении big data в рекламе28 мая 2015, 14:57
Рубрика «Digital» выходит при поддержке проекта «Одноклассники»
Популярные статьи
Показать еще
Комментарии отсортированы
как обычно по времени по популярности

Интересная вводная статья, о схеме работы всей системы...интереснее было бы увидеть её продолжение о DSP....вспомнил старый твит (авторство не помню, к сожалению): "Не знаешь что делать? Пили DSP!" )))

0

Хорошая статья, спасибо автору.

Откуда компании берут данные о действиях в интернете:

Счетчики посещений (LiveInternet), социальные кнопки (например, Pluso), рекламные сети и SSP (платформы для веб-издателей, посредством которых рекламные сети или сайты продают свои рекламные площади — прим. ред.), онлайн-чаты, виджеты.

А паблишеры знают о том, что данными посещений торгуют? Все те кто счетчик LI ставит к себе, например.

0

А сайты платят LiveInternet деньги за их услуги? Я думаю, что в termsheet все прописано. Но кто ж их читает-то?

0

Возможность комментирования статьи доступна только в первые две недели после публикации.

Сейчас обсуждают
Дмитрий Трипалюк
hyper weapon

Собственно, так и не нашел ответ на вопрос из заголовка ))

Почему бизнес-издание Inc назвало Riot Games лучшей компанией 2016 года
0
Salawat Waliullin

(экологии)

«Добро пожаловать в 2030 год»: член датского парламента о счастливой жизни без приватности и личных вещей
0
Salawat Waliullin

Насчет эконологии в Дании не уверен.
Насчет технологии тоже.
Скорее всего в каждом большом здании будет 3д-принтер, и в каждой комнате.
При необходимости он будет печатать все, от еды и коммуникаторов, до машин и нано-машин.
Города будут завалены мусором, но его будут постоянно убирать роботы.

Социальные пузыри, о которых она сейчас говорит, уже стали новым бичом цивилизации - их будут использовать в переворотах, как на Украине против Януковича, для победы на выборах, как в США 2016.
Люди будут заново учиться создавать и поддерживать сильные социальные связи.
Слабые социальные связи перестанут цениться вообще - все будут знакомыми со всеми.

«Добро пожаловать в 2030 год»: член датского парламента о счастливой жизни без приватности и личных вещей
0
Игорь Арнаков

Хорошая статья(нет).В том смысле хорошая, что хорошо демонстрирует логику стандартного работодателя.Суть тонны текста в ней легко свести к одной фразе:сложно найти нормального спеца на нашу смешную зарплату-мир несправедливо устроен,хнык-хнык. Причем отсутствует понимание элементарной вещи (которую даже школьник в состоянии понять)-хороший специалист и низкая зарплата-понятия в принципе несовместимые.

Почему в Санкт-Петербурге сложно найти дизайнера интерфейсов
2
Ефим Дутый

Скорее нет, чем да.
Правильно вокруг пишут, на нынешнем рынке труда быть "просто дезигнером" - дыра. Либо вы "круты", что в области дизайна означает в первую очередь громкие имена студий/заказчиков (потому что оценить сам дизайн в портфолио не может чуть менее чем никто, а тут - верификейшен). И стучите всем этим "аж кушать не можем как хотим гениального дизайнера на 700 баксов в месяц" по губам. Либо вы не круты, и идете по десять штук рубль, шо те старушки.

Почему в Санкт-Петербурге сложно найти дизайнера интерфейсов
0
Показать еще