Как собрать аудиторию по фотографиям пользователей «ВКонтакте» с помощью нейросети

В России по разным оценкам у 11-14% людей есть проблемы со зрением. Для бизнеса очкарики — масштабный и привлекательный рынок, а для рекламщиков — ад. Эту аудиторию трудно достать стандартными инструментами таргетинга. Главный таргетолог компании «Ашманов и партнёры» Артём Седов рассказал, как они с коллегами нашли 263 тысячи москвичей в очках во «…

Тестируем нейросеть с коллегами из «Ашманов и партнёры»
1818

А чем вы лучше Memedia Vision?

Они уже давно используют компьютерное зрение для поиска целевой аудитори во ВКонтакте.

Сегодня у них в группе кейс вышел как искать гитаристов для музыкального проекта.

Приложение бесплатное кстати. Отлично работает в паре с другими парсерами.

7

Мимедиа круче, я владельцев животных им искал!

4

Ну к мамедиа не припишешь же "ашманов нейросеть" и не продашь в три дорого

3

Подходы разные: мы находим всех пользователей из Вк по требуемому параметру (в простом кейсе в данной статье – только из Москвы, более 20 млн), а Мемедия анализирует загруженный пользователем список аккаунтов.
К слову, пару дней назад, когда они написали в Вк про детектор очков, я пытался воспользоваться их приложением Вк – ничего не работало. Пойду посмотрю, может, починили.

Едва ли давно.

Puzzle анонсировал собранную базу 14 марта.

Что касается нашего подхода: мы один раз прогнали всех и больше этого делать не нужно. За счет этого пользовательская база имеет внушительный объем.

Получить базу для серьезной кампании иным способом не рационально.

1

Ну что же, кто-то должен был начать:
Статья 9. Согласие субъекта персональных данных на обработку своих персональных данных
Статья 10. Специальные категории персональных данных
Статья 11. Биометрические персональные данные

5

А как, кстати, очки на лице относятся к "биометрическим данным"?

2

Комментарий недоступен

Ору с людей, сидящих ВК под настоящими именами и выкладывающих свои реальные фотографии, добровольно становясь таким образом публичными персонами, и после этого возмущающихся, что кто-то эти данные может собрать и обработать. Чтобы показывать рекламу очков, божечки-кошечки, какой ужас.

1

Ну вообще-то это одновременно и верно, и неверно. Законы и тексты такие есть, но применимость их здесь сомнительна.
Вы забыли о довольно большой дистанции между аккаунтом как неким профилем на некоем ресурсе и пользователем как человеком.
А кроме того, о том, что существующее пользовательское соглашение ВК само по себе незаконно, оперирует в серой зоне.

Закона об общедоступных данных в РФ пока нет, он сейчас пишется. Вряд ли он позволит ВК считать эти данные своими, приватизировать их.

4

Ну и вот это вообще цинизм:
"Администрация предоставляет доступ к персональным данным Пользователя только тем работникам, подрядчикам и агентам Администрации, которым эта информация необходима для обеспечения функционирования Сайта и предоставления Пользователю доступа к его использованию".

Что там с соглашением с НБКИ, например?

4

Ребята - красавцы, рынок нужно встряхнуть новыми технологиями.

По поводу сравнений с другими сервисами, которые умеют делать то же самое - ну и что? Есть они, и хорошо. Больше сервисов, выше конкуренция, конечный пользователь выигрывает.

4

Спасибо за интересную статью! Скажите пожалуйста, как вы отличаете солнезащитные очки от медицинских очков? В обоих случаях очки есть, значит это "1 - человек в очках". Не увидел этого в тексте.

Была ли дополнительная подстраховка от фейковых аккаунтов? Могли быть использованы, к примеру, фотографии знаменитостей в очках. Такие люди также попадут в выборку.

2

Солнцезащитные очки не вошли в обучающую выборку, поэтому сеть не знает что это такое. Сеть обучалась на лицах в очках для коррекции зрения. То есть на очках с прозрачными линзами.

От фейков пока не защитились. Так что такие пользователи немного подпортят базу. Мы не считали сколько их, на глаз их крайне мало.

Большую смуту вносят пользователи, у которых на аватарке есть этот самый пользователь и друг в очках. Как защититься от такого мы придумали.

2

Спасибо за метод и статью, работа действительно представляет очень большой интерес! Скажите а как таргетировать эту базу? Спарсили вы аккаунты, окей, а что дальше? ВК не дает таргетить аккаунты, куки на ВК для показов где-то еще вы так же не разметите, поскольку у вас нет доступа к кодам на ВК. Разметить их вы можете только в каких-то приложениях (что долго и не надежно) или кликджеккингом, что вообще дно. Как вы выделите этих юзеров для показов если у вас к их кукам нет доступа? Вне ВК это будет пустая кука. Хм, или я что-то проспал в таргетах вк?

1

Немножко проспали. Но это вопрос содержания статьи. Мы связываем изображение с конкретным аккаунтом. У каждого аккаунта есть идентификатор в URL. В ВК есть специальный раздел ретаргетинга, в который можно загрузить список идентификаторов пользователей. Это весь трюк.

То есть на выходе у нас список идентификаторов аккаунтов ВКонтакте, на изображениях которых мы нашли очки.

2

Насколько я понимаю в таргетированной рекламе (это Арём специалист), ВК позволяет загрузить в рекламную кампанию список конкретных аккаунтов, кому показать рекламу.

2

Фото-отчет с etarget2018 из того, что было в телефоне. Нормальные фото и видео с доклада приедут позже. Всем специалиставм понравилось. Представителям ВКонтакте тоже.

2

Очки в руках, очки на лбу. И все. Эти люди не входят в выборку. Но они очкарики, просто очки не на глазах в момент позирования.

https://vk.com/terms

5.8. Обработка персональных данных Пользователя осуществляется в соответствии с законодательством Российской Федерации. Администрация Сайта обрабатывает персональные данные Пользователя в целях предоставления Пользователю доступа к использованию функционала Сайта, в том числе в целях получения Пользователем персонализированной (таргетированной) рекламы; проверки, исследования и анализа таких данных, позволяющих поддерживать и улучшать функционал и разделы Сайта, а также разрабатывать новый функционал и разделы Сайта. Администрация Сайта принимает все необходимые меры для защиты персональных данных Пользователя от неправомерного доступа, изменения, раскрытия или уничтожения. Администрация предоставляет доступ к персональным данным Пользователя только тем работникам, подрядчикам и агентам Администрации, которым эта информация необходима для обеспечения функционирования Сайта и предоставления Пользователю доступа к его использованию. Администрация Сайта вправе использовать предоставленную Пользователем информацию, в том числе персональные данные, а также передавать ее третьим лицам, в целях обеспечения соблюдения требований действующего законодательства Российской Федерации, защиты прав и интересов Пользователей, Администрации Сайта, третьих лиц (в том числе в целях выявления, проверки/расследования и/или пресечения противоправных действий). Раскрытие предоставленной Пользователем информации может быть произведено лишь в соответствии с действующим законодательством Российской Федерации по требованию суда, правоохранительных органов, а равно в иных предусмотренных законодательством Российской Федерации случаях. Поскольку Администрация Сайта осуществляет обработку персональных данных Пользователя в целях исполнения настоящих Правил, в силу положений законодательства о персональных данных согласие Пользователя на обработку его персональных данных не требуется.

Вообще, кстати, стоит внимательнее вчитаться в то, что цитируете. А именно в этот кусок соглашения ВК:

"... Администрация Сайта вправе использовать предоставленную Пользователем информацию, в том числе персональные данные, а также передавать ее третьим лицам, в целях обеспечения соблюдения требований действующего законодательства Российской Федерации, защиты прав и интересов Пользователей, Администрации Сайта..."

И выделить главное, что относится к нашей теме. Если отбросить постороннее и показушное, мы видим, что:

"Администрация Сайта вправе использовать предоставленную Пользователем информацию, в том числе персональные данные, а также передавать ее третьим лицам, в целях .....защиты прав и интересов ... Администрации Сайта".

Сделано это, конечно, юристами ВК. Специально прослоено правами пользователей, безопасностью и законностью, чтобы не так бросалось в глаза.

Означает то же, что написано в пользовательских соглашениях ФБ, Твиттера, Гугла и прочих:
***Можем и будем использовать ваши данные для рекламы, а также продавать ваши данные своим партнёрам и другим третьим лицам по своему усмотрению. А вы согласились с этим.***

1

Что мешает тебе не выкладывать в публичный доступ свои ФИО и фотографии?

import tensorflow as puzzlelib :)

В этом году планируем PuzzleLib в Open Source выложить, сможете сравнить коды библиотек =)

1

Статья прямо к месту, как раз разработчикам напомнили, что 25-го мая вступает в полную силу GDPR. Вот по ссылке интересный разбор примеров, в том числе там и про определение людей с плохим зрением.
https://medium.com/droidsonroids/what-does-gdpr-mean-for-mobile-app-owners-12-use-cases-e047500772e3

О таких инструментах теперь надо молчать.

Там как раз про проблемы со зрением довольно прикольный ответ. Похоже, они вообще имеют особое мнение про ПРОИЗВОДНЫЕ, вычисляемые данные.

1

А зачем продавать идею? Зарабатывайте на ней если можете. Просто очередной развод. Если в руках мощных инструмент для заработка? Зачем его продавать другим? Да и много людей вы знаете, которые на своих фотографиях в очках?

Так у нас не идея, а уже готовый продукт. Базы аудиторий, на которые можно таргетировать рекламу, полученные с помощью анализа изображений. Первая такая собранная аудитория – профили с фото в очках.

Алексей, мы нашли 263 тысячи профилей "в очках" в Москве и области. И эта выборка легко масштабируется за счёт других регионов, если нужен федеральный охват. Очки не единственное, что можно найти на фотографии. Фото содержат массу информации, которая была недоступна для таргетинга, и мы это исправили с помощью машинного обучения. Нам кажется, это важно для маркетологов. Успехов Вам и спасибо за комментарий.