Большой брат или большие данные: как запрет сторонних cookies спровоцирует бум ИИ на рекламном рынке

Google и Apple строят свои экосистемы, ограничивая сторонним компаниям доступ к данным. А пользователи опасаются слежки, но хотят получать релевантный контент. Со-основательница рекламной платформы Buzzoola Наталия Солодухова и CTO проекта Антон Гавриш рассказывают о том, что происходит на рынке рекламного таргета и какую роль в этом играет ИИ.

Большой брат или большие данные: как запрет сторонних cookies спровоцирует бум ИИ на рекламном рынке

Зловещий таргет и фантомная слежка

Точность персонализации рекламы растет с каждым годом, при этом вопросы конфиденциальности встают все более остро. В интернете собрано немало историй о «зловещем таргетинге» — рекламном контенте на сайтах и в соцсетях, который пугающе точно соответствовал запросам пользователя или навязчиво напоминал ему о неприятных событиях. Недавно журнал WIRED писал о девушке, у которой сорвалась свадьба, однако еще несколько месяцев она получала таргетированные спецпредложения для молодоженов, а онлайн-магазины настойчиво напоминали ей о годовщине.

Рекламные сообщения также меняют содержание и тон, адаптируясь под взгляды разных сегментов аудитории. Например, нефтяная компания Exxon показывает либералам контент, где выражает свою заботу об экологии, а консерваторам, наоборот, выдает ссылку на петицию против регулирования нефтяной индустрии. Есть и другие прецеденты, когда алгоритмы знают о человеке больше, чем он сам. Так, TikTok часто предлагает пользователям контент, предугадывая и даже предсказывая их предпочтения, например, сексуальную ориентацию. Об этом писал историк и футуролог Юваль Ной Харари — он предположил, что на каком-то этапе алгоритмы на базе машинного обучения начали управлять нашими вкусами и даже волей.

Впрочем, возможности рекламного таргета часто переоценивают. Например, предположения о прослушке, которую в фоновом режиме ведут наши смартфоны, пока так и не подтвердились, хотя некоторые приложения действительно собирают аудиоданные с разрешения пользователей (только даем мы его неосознанно, бездумно ставя галочку в Terms & Conditions). Во многих случаях мы строим конспирологические теории вокруг банальных совпадений. Так, в начале 2010-х СМИ облетела история о девушке-подростке, которая скрывала беременность от родителей. Но рекламная рассылка от супермаркета Target выдала ее положение — компания прислала девушке купоны со скидками на одежду и мебель для младенцев, и семья узнала о тайной беременности. Многие факты в этой истории не сходятся, а историю ставят под сомнение даже data-аналитики — торговые сети регулярно проводят акции на отдельные товары, и это как раз такой случай.

Идея о том, что корпорации записывают и анализируют все разговоры пользователей, распространилась благодаря феномену Баадера — Майнхоф. Если человек недавно узнал нечто новое, а затем вновь услышал об этом, ему кажется, что явление приобрело массовый характер. Хотя на самом деле это не так.

Рекламные монополисты

«Крестовые походы» против рекламы активно ведутся. На волне хайпа про приватность данных в начале 2020-го Google объявила, что перестанет поддерживать сторонние cookie-файлы в Chrome в течение двух лет. Это означает, что условный онлайн-магазин сможет собирать, анализировать и использовать cookies на своем ресурсе, но не сможет на основе собранных данных отслеживать перемещение пользователей между площадками и предлагать им рекламу на сторонних сайтах. Для игроков рекламного рынка, которые сейчас используют cookie для идентификации пользователей, Google тестирует альтернативные решения, например, формат FLoC, в котором аудиторию делят на когорты по интересам.

Apple также давно включилась в борьбу за конфиденциальность пользователей — ее браузер Safari уже давно блокирует сторонние cookies, а в новой операционной системе iOS 14.5 появилась антитрекинговая система. Из-за этого Facebook даже намекнула на введение платного функционала — без трекинга IT-гигант может лишиться части дохода. Впрочем, Google, Apple, Facebook и другие крупные интернет компании преследуют свои интересы — они создают замкнутые экосистемы (walled gardens), в которой сторонним игрокам нет места либо вести бизнес невыгодно. При этом, сами корпорации продолжают собирать необходимые данные и извлекают из них пользу. Достаточно вспомнить недавнюю проблему с конфиденциальностью в macOS Big Sur.

Интересно, что людям на самом деле нужна персонализированная реклама — на эту потребность указывает 70% пользователей. Более того, запрос на таргетированный контент достиг пика именно в 2020-е. Однако только 17% считает мониторинг активности в интернете этичной практикой со стороны частных компаний. Получается, что запрос на персонализацию рекламы и контента есть, но расплачиваться персональными данными формально люди не готовы. И, тем не менее, мы постоянно делимся личными сведениями с корпорациями — когда оплачиваем покупки безналом, использует фитнес-трекеры, карты лояльности, сервисы такси и доставки еды. Современные экосистемы с широким набором сервисов знают о нас все и даже больше, а их охват расширяется с каждым годом. Лучший вариант защититься от таргета — отключиться от сети и поселиться в хижине в лесу. К счастье, есть и другие варианты. Например, новые технологии персонализации на базе ИИ.

Алгоритмы таргета

Главная задача любого персонализированного контента (рекламного и не только) — это повышение конверсии, а точность таргетирования играет в этом процессе определяющую роль. Вряд ли вас заинтересует реклама турецкого курорта в период локдауна или покупка зимней куртки летом. Студенту нет смысла показывать сервис покупки недвижимости, а молодой женщине без детей навязчиво предлагать детские коляски и игрушки.

Но как составить портрет пользователя? Сделать это можно разными способами: изучить историю действий, провести опрос или проанализировать паттерны поведения. Для этого как раз применяются cookie-файлы — наши цифровые следы, которые помогают сайтам нас идентифицировать. Когда пользователь впервые попадает в поле зрения рекламной платформы, она вносит в браузерные файлы уникальный набор символов — идентификатор, или UserID (UID). В дальнейшем он поможет опознать пользователя на любом сайте, где присутствует программный код этой платформы. Например, вы рассматриваете новые кроссовки на сайте спортивного бренда, а потом видите рекламу приглянувшихся моделей в Facebook — все благодаря cookies.

Отслеживая вашу активность между сайтами, сервис понимает, какие темы вас интересуют, в какое время суток вы бываете в сети, где находитесь географически, с какого устройства заходите. Платформы обмениваются данными, постепенно обогащая свое «досье» на каждого пользователя. И, все равно, картина часто остается неполной, а портрет получается слишком абстрактным. Извлечь ценность из потока данных помогают системы на базе машинного обучения — главный тренд AdTech рынка настоящего и ближайшего будущего. Как ни странно, но регулирование стало драйвером этого направления — например, после введения Общего регламента по защите данных (GDPR), датасеты стали более «чистыми»и структурированными. Алгоритмы тоже постоянно эволюционируют. Вот лишь несколько относительно новых сценариев применения ИИ в таргетинге:

  • Динамическая оптимизация креативов (DCO): адаптация рекламного контента с учетом интересов пользователя. Приведенный выше пример с нефтяной компанией Exxon — это как раз образец DCO. Технология позволяет быстро реагировать на любые изменения и подстраиваться под обстоятельства: например, онлайн-магазин может предлагать определенные товары с учетом конкретных погодных условий, а сервис беттинга предложит поставить на футбольную команду, которая играет именно сегодня. Креатив постоянно оптимизируется и совершенствуется в режиме реального времени — если какой-то контент заходит плохо, его можно заменить или перенастроить.
  • Коллаборативная фильтрация на базе глубокого обучения (Deep Collaborative Filtering) — составление матриц пользователей и ранжирование выдачи в зависимости от категории ЦА. Чаще всего применяется онлайн-магазинами, например, Amazon.
  • Понимание естественного языка (Natural Language Understanding) — анализ семантики и определение содержания текста и контекста, а не отдельных фраз и слов.
  • Выявление мошенничества с помощью ИИ — алгоритмы помогают определить накрутки, распознать ботов и выявить фальшивый трафик.
  • Ретаргетинг — вовлечение «спящих» пользователей, которые прежде уже обращались к сервису и оставили цифровой след.
  • Слияние обезличенных данных из разных источников для составления портрета аудитории, поделенного на отдельные когорты и матрицы. На этом принципе строится механика новой системы FLoC от Google, а также других систем post-cookies эпохи. Они позволяют проводить аналитику на устройстве пользователя в режиме реального времени, соотносить группы ЦА с определенными когортами и подбирать контент. При этом данные не хранятся на серверах компании, а сторонние лица не имеют к ним доступа. Чаще всего эти инструменты работают в связке с универсальным идентификатором пользователя. Эту концепцию уже поддерживают многие отраслевые объединения, например, The Advertising ID Consortium, Unified ID и DigiTrust. Команда Buzzoola тоже включена в этот процесс и формирует аналогичное объединение на российском рынке.

Все инструменты на базе ИИ можно комбинировать между собой, а также использовать классические системы трекинга и идентификации. В перспективе они позволят точечно предлагать клиентам товары и услуги, не нарушая при этом регламентов о защите данных. Современные системы пока не совершенны, но они эволюционируют с каждым годом — появляются новые технологии, обнаруживаются новые уязвимости, вводят новые правила регулирования. Например, сейчас FLoC активно критикуют, но внедрение этого стандарта задает новый тренд на рынке, который спровоцирует рост других умных инструментов для сбора и аналитики данных. Так что рекламная индустрия будет становиться все более интеллектуальной с каждым годом. Товары, о покупке которых вы только начали задумываться, появятся у вас в ленте. Но не потому, что компания вторглась в ваше сознание, а потому, что ее алгоритмы научились лучше ориентироваться в потоке больших данных.

3333
11 комментариев

Да все верно и эта реальность всё ближе...  Черт побери я даже сам участвую в этом ужасном процессе так как это востребовано на рынке а не потому что мне это нравится. (((

2
Ответить

Что ты делаешь?

Ответить

Комментарий недоступен

2
Ответить

Комментарий недоступен

2
Ответить

интересно, локальные конторы и дальше будут лепить кампейны на фб и гугле по сути, но всегда есть место креативу - возможно реклама в том виде в котором мы ее знаем как раз будет провоцировать новые возможности

1
Ответить

Платите мне напрямую в стейблах 90% от рекламного бюджета, я вам сам всё расскажу и во всем признаюсь )

1
Ответить

"как запрет сторонних cookies спровоцирует бум ИИ на рекламном рынке"

О чем я только что прочитал? Тема сисек не раскрыта

1
Ответить