Почему Facebook невыгодно прослушивать пользователей ради таргетирования рекламы Статьи редакции
Партнёр венчурного фонда Gagarin Capital Николай Давыдов написал о популярном мифе о том, что Facebook использует смартфоны, чтобы анализировать беседы пользователей вживую.
Опять кто-то написал, что Facebook слушает их разговоры, чтобы рекламу подбирать. Я сначала очень много времени занимался рекламными технологиями, потом машинным обучением, да и Facebook я знаю не понаслышке. Поэтому давайте по порядку (в конце будет анекдот!).
Технологии
Нормально выцеплять ключевые слова с телефона в кармане штанов, в офлайне, — практически невозможно. Те, кто верит, что Facebook такую «слушалку» запилил, явно не пытались договориться с Siri, Alexa или «Алисой». Кстати, и они работают только в онлайне. Если «слушать» вас в реалтайме и обрабатывать вашу речь в облаке, Facebook разорится как минимум на трафике, я уж не говорю про все железо, которое нужно, чтобы это процессить, и электричество, на которое в прошлом году выгоднее было эфир майнить.
Экономика
Рекламные технологии по низкочастотным запросам работают, только если они предельно дешевые. Рекламодатель не будет платить больше условных 5-10 баксов за тысячу показов рекламы. Facebook со всей своей эффективностью, скорее всего, держит стоимость показа на уровне не выше двух-двух с половиной центов, предельно оптимизируя, и продавая эту рекламу с оплатой за действие. «Прослушивание» вашей жизни будет стоить явно дороже тех 10 центов в день, которые вы максимально сможете сгенерить для Facebook, листая ленту. И то 10 центов — это если вы входите в аудиторию жителей США с высоким уровнем дохода.
Ограничения
Давайте визуализируем. Корпорация Facebook, в которой работает более 30 тысяч человек (это полностью забитый «Олимпийский»), используя телефоны Apple (130 тысяч сотрудников) и Google (85 тысяч сотрудников), которые вообще делают еще 150 разных корпораций, секретно слушает разговоры Васи и Маши в баре на Патриарших. Дополним визуализацию: действие происходит в Кремниевой долине, штат Калифорния, где ежедневно всплывают любые вещи, которые кто-то где-то пытался умолчать. И никто, никто не шепнул это журналюгам WSJ, которые ночами не спят, ищут, как еще бы прищемить нос Цукербергу.
Целесообразность
Ваш цифровой след и без «прослушки» феноменален. Вы листаете ленты Facebook и Instagram, лайкаете, шарите, пересылаете сообщения, на каких-то постах задерживаетесь дольше, в какие-то уведомления кликаете сразу.
Вы гуглите информацию, вы читаете новости и пишете электронные письма, вы ходите на сайты, вы совершаете покупки в онлайне и офлайне (да, Visa и Mastercard тоже от всей души торгуют вашими данными, вместе с владельцами программ карт лояльности).
Дальше несколько умных датасатанистов сели и налепили предикторов, которые понимают, когда, кому и какую рекламу стоит показать, чтобы максимизировать шанс продажи этого товара.
Вот вам пример: Петя, высокооплачиваемый менеджер, покупал машину три с половиной года назад. Недавно Петя оплатил несколько счетов в автосервисе, но не продлил страховку. Два петиных друга, находившихся с ним в одной геолокации, в этот момент загуглили "BMW X5" и "Audi Q7". Петя приходит домой и видит рекламу "Mercedes GLS", о котором он говорил с друзьями в баре. ОБОЖЕМОЙ FAcebook его подслушивал!
Напоследок вот вам анекдот: Советский Союз. Мужик в командировке с друзьями сидит в гостинице. Выходит в коридор, видит горничную и просит: «Принесите, пожалуйста, через 10 минут три чашки кофе». Заходит обратно, друзья травят политические анекдоты. Он им: «Товарищи, вы бы лучше не шутили на эти темы, мало ли кто нас слушает».
Друзья, конечно, над ним смеются, он встает, подходит к розетке, выдергивает из нее телевизор, наклоняется к ней и говорит: «Товарищ майор, раз уж все равно с утра на Лубянку, можно хотя бы нам три чашечки кофе сейчас». Все ржут. Тут открывается дверь, горничная вносит три чашки кофе. Друзья в шоке, молча ложатся спать.
С утра мужик просыпается в номере от шума, встает и видит, как чекисты выводят его друзей. К нему подходит лейтенант и говорит: «Спасибо за бдительность, товарищ Петров, товарищ майор просил передать, что ему очень ваша шутка про кофе понравилась».
Я не говорю, что вас нельзя «слушать» и даже «видеть» через все ваши гаджеты. Но это если вам есть, что скрывать, а явно не для того, чтобы вам рекламу показывать.
Лол. Обучаешь нейронку на ключевые слова, она детектит эти слова локально на устройстве и отсылает в фейсбук. И никакого трафика.
Лол. А что будет с аккумулятором и охлаждением, если постоянно распознавать речь на телефоне? У той же Apple для "hey siri" отдельный чип, который позволяет телефонам реагировать только на одну фразу и не жрать батарейку постоянно.
Сила маркетинга. Чем отдельное ядро эпл отличается от одного ядра восьмиядерного проца любого андроида ?
Тем, что это не отдельное ядро, а специализированный чип. Это нельзя сделать на ядре общего назначения.
Ну в современны ARM'ы давно уже встраивают все что нужно для AI и DSP, плюс есть энергосберегающий режим. Отдельный чип это скорее решение которое просто лучше ложится в существующую архитектуру эппловских девайсов.
Отдельный чип нужен не для особых инструкций, а для уменьшения энергопотребления. Потому что он заточен под одну задачу и делает это максимально эффективно.
Сомнительно. Очевидно, что с одной задачей отдельный проц справляется максимально эффективно, но вопрос в том, насколько эффективно использовать отдельный проц под одну задачу? Конечно, если мы говорим про телефон, который по сути даже в ожидании все равно выполняет множество процессов.
Эм, почему ? Будь не так эмэйзин ?
Зачем вы сами спрашиваете, если знаете ответ? Всё же сами объяснили. В Яндекс.Телефоне похожая схема формально позволяет смартфону, лежащему в кармане, постоянно слушать вас с помощью сопроцессора, отсеивать лишнее с помощью небольшой нейросети и передавать на сервер только нужную информацию. Всё это(опять же формально) с минимальными энергозатратами. Если "лишнее" можно настроить на сервере Яндекса и прислать с очередным обновлением (или без него), то я не вижу никаких проблем. Просто в условия активации к фразе "Привет, Алиса!" тайно добавляем фразы "Куплю", "Хочу купить", "Пойду покупать". Я не говорю, что так и есть. Но теоретически с этим проблем никаких. А дальше можно обучать нейросеть правильным сигналам. В итоге по аналогии с яндекс.директ окажется, например, что фраза "куплю" выйдет неэффективной, потому что слишком общая и много ложных срабатываний по ней. Она отсеется как экономически неэффективная, а фраза "выбираю автомобиль жене" окупит себя и создаст хорошую базу для таргетинга. В директе в дорогих нишах несколько десятков кликов могут окупить все затраты на вычисления
чтобы реагировать на одну единственную фразу
ну да
Случаев как у Артема и Дениса достаточно, чтобы заставить задуматься.
Вот только вряд ли каждое приложение имеет свой обработчик. Логичнее корпорациям сделать прайват апи и его предоставлять тем, кто отбашляет.
P.S. можно попробовать поиграться с чекбоксом "персонализировать рекламу" в настройках приватности телефона
Логичнее корпорациям вообще этого не делать.
почему? Таргетинг рекламы существует на уровне устройства. Прайват апи - тоже не секрет. Ничего не мешает обрабатывать речь и отдавать ключевые слова. По поводу примера Павла, да, соглашусь, но это не оправдывает спонтанные разговоры с коллегами и последствующая реклама на тему разговоров
Много чего мешает. Начиная от законов, заканчивая репутационными рисками. Никто больше не купит телефон, если выясниться, что он прослушивает владельца. Вы сами купите?
о это не оправдывает спонтанные разговоры с коллегами и последствующая реклама на тему разговоровЭто может быть совпадением, или разговор может быть не спонтанным, или кто-то в офисе после разговора мог поискать инфу в интернете, или зайти на тематический сайт. Анекдотическое свидетельство - это очень плохой аргумент.
Да не то, что мог поискать — масса разнообразных данных могла к этому вести.
Все гораздо проще, если есть исходные данные. Избитый пример:
https://habr.com/ru/post/147284/
Ну тем более, если есть чип который 100% времени слушает "hey siri", почему бы еще не договорится с Apple насчет фраз "купить что-то", "продать что-то", "заказать что-то" и т.д.
После этих ключевых фраз включается уже более сильный алгоритм, аналогично как с "hey siri", после этой фразы данные уже обрабатываются более серьезным алгоритмом на сервере Apple.
Ну да, ну да. Apple ведь так насрать, что ради непонятной выгоды она будет рисковать репутацией и давать facebook возможность прослушивать себя.
рисковать репутацией? Люди уже третий год покупают макбуки, у которых клавиатура через пол года ломается и продолжают боготворить эпл.
Таргетинг рекламы уж точно не поставит под сомнение "илитарную" продукцию
Ломается — штука совсем не того же уровня, что и жучок в телефоне.
Ну это единственный аргумент с которым я отчасти соглашусь.
С другой стороны если Apple/Facebook/etc договариваются о том что бы не переманивать сотрудников друг друга, то почему они не могут договорится о закрытом API для прослушки, если это приносит довольно много денег и откаты могут быть существенные.
Тем более китайцы давно уже активно всех прослушивают, не думаю что Apple будет тут терять конкурентное преимущество. Тем более не обязательно заключать официально соглашение, можно просто "слить" доступ к закрытому API, и в случае шухера обвинить Facebook в эксплуатации уязвимости.
Я лично не верю, что корпорации имея техническую возможность прослушивать своих пользователей будут руководствоваться соображениями морали и нравственности, а не желанием максимизировать прибыль.
Мораль и нравственность тут не при чем, речь о репутации. Кроме того, закон почти любой страны запрещает прослушку. Вы представляете какие могут быть юридические последствия?
Да никаких юридических последствий не будет.
Майкрософт же ловили на том что они сохраняются пароли и их краулеры пользуются паролями для входа на закрытые веб-сайты)
Что? Покажите законы, которые бы запрещали сохранять пароли. А законы о запрете прослушки есть и это уголовка.
Да это одно и тоже) нет принципиальной разницы - прослушивать вашу речь или прослушивать то что вы набираете на клавиатуре.
При этом запрещена "незаконная прослушка", а если пользователь согласен на "обработку медиаданных для улучшения поиска и повышения качества контекстной рекламы", то в чем нарушение?
Ну т.е. облечь в нужную юридическую форму, слить какие-то данные силовикам и все - репутационные издержки улажены.
Разница есть.
При этом запрещена "незаконная прослушка", а если пользователь согласен на "обработку медиаданных для улучшения поиска и повышения качества контекстной рекламы", то в чем нарушение?В том, что в такой интерпретации, почти любая прослушка законна.
репутационные издержки улажены.Репутационные издержки и силовики - это разные проблемы.
А кто-нибудь из корпораций-гигантов или ихних боссов за последние лет 5 пострадал за прослушку? Кого-нибудь уволили, оштрафовали, посадили? Я что-то не могу сходу вспомнить
А где-то уже были найдены случаи массовой прослушки какой-то корпорацией?
Именно таких случаев не могу вспомнить сразу. Обычно на этом всякие спецслужбы палятся. Впрочем, не упомню, что бы и там кого-то хоть как-то наказали. Корпорации пока что палятся на слежке. Типа как Гугл следил за андроид-юзерами, даже при всех отключенных GPS.
Да и в целом как-то странно: скандалы со сливом данных, слежкой и прочими прайваси-факапами происходят регулярно, но я не могу вспомнить НИ ОДНОГО случая, когда за это кто-нибудь реально бы пострадал. Не в смысле «Ой, Кембридж аналитика, удар по репутации, потеря капитализации» и прочей довольно виртуальной фигни, а когда конкретно кого-то оштрафовали или посадили
Ну это уже тонкости. Если вернуться к теме статьи, то техническая возможность обрабатывать речь, дергать ключевые слова и отправлять куда-то существует. В iPhone есть чип для обработки речи, у Android'ов стоят крутые ARM'ы с сопроцессорами для DSP, AI и энергосберегающим режимом.
Есть только организационные и юридические ограничения.
ТЗ такие ТЗ.
Если вернуться к теме статьи, то техническая возможность обрабатывать речь, дергать ключевые слова и отправлять куда-то существует.Конечно существует, только не долго, потому что проц нагреется и сожрет все питание. См. мое первое сообщение.
В iPhone есть чип для обработки речиКоторый постоянно слушает только "hey siri".
Есть только организационные и юридические ограничения.Ну да, это ведь такая мелочь.
Да ничо он не сожрёт) Я просто занимаюсь обработкой звука, и даже на iPhone в бородатом 2010 году можно было юзать специальный чип для DSP доступ к которому идет через библиотеку Accelerator который позволял слушать и анализировать звук тратя 5% энергии. Ну т.е. это хватало на много часов работы. Сейчас это еще проще делать. Конечно, Apple уведомляет о записи звука, показывая зелёненькую полоску. Но вполне допускаю что крупные компании, типа Facebook вполне могут это делать втихую.
К тому же, например, я пользуюсь Apple Watch и заряда хватает только на 24 часа. Хотя аналогичные часики от Huawei держат заряд 7 дней. Вопрос - куда жрется энергия? Функционал примерно одинаков.
У Apple всегда были слабые аккумуляторы в мобильных и носимых устройствах.
Смотря как анализировать. Если речь об FFT, то конечно много энергии не надо, хотя и это может съесть батарейку за 2-3 часа. Но FFT это далеко не распознавание речи.
Конечно, но нейросети прожорливы только при обучении и подстройке. Когда они работают в режиме распознавания, то это просто перемножение с весовыми коэффициентами и суммирование. Для распознования "hey siri" используется вектор длиной в 13 отсчетов. Т.е. это очень простая нейронка.
Так что нет технической проблемы в том что бы кроме "hey siri" распознавать и пару десятков других ключевых слов нужных для маркетинга, а потом запускать уже полноценный прожорливый алгоритм.
Комментарий удален модератором