Метчинг пользователей между браузерами и девайсами строится на основании ML модели поиска объектов для метчинга. Делается так: 1. Извлекаются данные из источника данных, например куки из клики стрима на веб сайте 2. контексты на веб сайте, это все что пользователь вбил в разные там формочки 3. Параметры прогоняются через глобальный список параметров для слияния и выявляются те, которые могут дать высокую точность объединения профилей 4. Срабатывает процедура слияния 5. Проверяется качество построенных профилей, найденные параметры через векторную модель дообогащают профиль новыми связанными значениями 6. Некачественные параметры понижаются в глобальном ранге 7. Некачественные связи слияния блокируются и изымаются из рекурсии
И так до бесконечности. Параметров для метчинга очень много, от куки до емейла, или гиперссылки между двумя объектами.
Ну и плюс все это в глобальной сети отслеживания, сейчас мы видим около 200 млн браузеров в РФ, объединённых в цифровые паспорта.
ps. Источниками данных также являются CRM, wifi, и так до бесконечности, вплоть до логов телефонных станций.
Но это лишь первый этап работы, получение более точных данных для моделей оптимизации рекламы. Второй, это построение предиктивной модели оптимизации.
Метчинг пользователей между браузерами и девайсами строится на основании ML модели поиска объектов для метчинга. Делается так:
1. Извлекаются данные из источника данных, например куки из клики стрима на веб сайте
2. контексты на веб сайте, это все что пользователь вбил в разные там формочки
3. Параметры прогоняются через глобальный список параметров для слияния и выявляются те, которые могут дать высокую точность объединения профилей
4. Срабатывает процедура слияния
5. Проверяется качество построенных профилей, найденные параметры через векторную модель дообогащают профиль новыми связанными значениями
6. Некачественные параметры понижаются в глобальном ранге
7. Некачественные связи слияния блокируются и изымаются из рекурсии
И так до бесконечности. Параметров для метчинга очень много, от куки до емейла, или гиперссылки между двумя объектами.
Ну и плюс все это в глобальной сети отслеживания, сейчас мы видим около 200 млн браузеров в РФ, объединённых в цифровые паспорта.
ps. Источниками данных также являются CRM, wifi, и так до бесконечности, вплоть до логов телефонных станций.
Но это лишь первый этап работы, получение более точных данных для моделей оптимизации рекламы. Второй, это построение предиктивной модели оптимизации.