Почему Facebook невыгодно прослушивать пользователей ради таргетирования рекламы Статьи редакции

Партнёр венчурного фонда Gagarin Capital Николай Давыдов написал о популярном мифе о том, что Facebook использует смартфоны, чтобы анализировать беседы пользователей вживую.

Опять кто-то написал, что Facebook слушает их разговоры, чтобы рекламу подбирать. Я сначала очень много времени занимался рекламными технологиями, потом машинным обучением, да и Facebook я знаю не понаслышке. Поэтому давайте по порядку (в конце будет анекдот!).

Технологии

Нормально выцеплять ключевые слова с телефона в кармане штанов, в офлайне, — практически невозможно. Те, кто верит, что Facebook такую «слушалку» запилил, явно не пытались договориться с Siri, Alexa или «Алисой». Кстати, и они работают только в онлайне. Если «слушать» вас в реалтайме и обрабатывать вашу речь в облаке, Facebook разорится как минимум на трафике, я уж не говорю про все железо, которое нужно, чтобы это процессить, и электричество, на которое в прошлом году выгоднее было эфир майнить.

Экономика

Рекламные технологии по низкочастотным запросам работают, только если они предельно дешевые. Рекламодатель не будет платить больше условных 5-10 баксов за тысячу показов рекламы. Facebook со всей своей эффективностью, скорее всего, держит стоимость показа на уровне не выше двух-двух с половиной центов, предельно оптимизируя, и продавая эту рекламу с оплатой за действие. «Прослушивание» вашей жизни будет стоить явно дороже тех 10 центов в день, которые вы максимально сможете сгенерить для Facebook, листая ленту. И то 10 центов — это если вы входите в аудиторию жителей США с высоким уровнем дохода.

Ограничения

Давайте визуализируем. Корпорация Facebook, в которой работает более 30 тысяч человек (это полностью забитый «Олимпийский»), используя телефоны Apple (130 тысяч сотрудников) и Google (85 тысяч сотрудников), которые вообще делают еще 150 разных корпораций, секретно слушает разговоры Васи и Маши в баре на Патриарших. Дополним визуализацию: действие происходит в Кремниевой долине, штат Калифорния, где ежедневно всплывают любые вещи, которые кто-то где-то пытался умолчать. И никто, никто не шепнул это журналюгам WSJ, которые ночами не спят, ищут, как еще бы прищемить нос Цукербергу.

Целесообразность

Ваш цифровой след и без «прослушки» феноменален. Вы листаете ленты Facebook и Instagram, лайкаете, шарите, пересылаете сообщения, на каких-то постах задерживаетесь дольше, в какие-то уведомления кликаете сразу.

Вы гуглите информацию, вы читаете новости и пишете электронные письма, вы ходите на сайты, вы совершаете покупки в онлайне и офлайне (да, Visa и Mastercard тоже от всей души торгуют вашими данными, вместе с владельцами программ карт лояльности).

Дальше несколько умных датасатанистов сели и налепили предикторов, которые понимают, когда, кому и какую рекламу стоит показать, чтобы максимизировать шанс продажи этого товара.

Вот вам пример: Петя, высокооплачиваемый менеджер, покупал машину три с половиной года назад. Недавно Петя оплатил несколько счетов в автосервисе, но не продлил страховку. Два петиных друга, находившихся с ним в одной геолокации, в этот момент загуглили "BMW X5" и "Audi Q7". Петя приходит домой и видит рекламу "Mercedes GLS", о котором он говорил с друзьями в баре. ОБОЖЕМОЙ FAcebook его подслушивал!

Напоследок вот вам анекдот: Советский Союз. Мужик в командировке с друзьями сидит в гостинице. Выходит в коридор, видит горничную и просит: «Принесите, пожалуйста, через 10 минут три чашки кофе». Заходит обратно, друзья травят политические анекдоты. Он им: «Товарищи, вы бы лучше не шутили на эти темы, мало ли кто нас слушает».

Друзья, конечно, над ним смеются, он встает, подходит к розетке, выдергивает из нее телевизор, наклоняется к ней и говорит: «Товарищ майор, раз уж все равно с утра на Лубянку, можно хотя бы нам три чашечки кофе сейчас». Все ржут. Тут открывается дверь, горничная вносит три чашки кофе. Друзья в шоке, молча ложатся спать.

С утра мужик просыпается в номере от шума, встает и видит, как чекисты выводят его друзей. К нему подходит лейтенант и говорит: «Спасибо за бдительность, товарищ Петров, товарищ майор просил передать, что ему очень ваша шутка про кофе понравилась».

Я не говорю, что вас нельзя «слушать» и даже «видеть» через все ваши гаджеты. Но это если вам есть, что скрывать, а явно не для того, чтобы вам рекламу показывать.

0
133 комментария
Написать комментарий...
денькя
Если «слушать» вас в реалтайме и обрабатывать вашу речь в облаке, Facebook разорится как минимум на трафике, я уж не говорю про все железо, которое нужно, чтобы это процессить, и электричество, на которое в прошлом году выгоднее было эфир майнить.

Лол. Обучаешь нейронку на ключевые слова, она детектит эти слова локально на устройстве и отсылает в фейсбук. И никакого трафика.

Ответить
Развернуть ветку
Nikita

Лол. А что будет с аккумулятором и охлаждением, если постоянно распознавать речь на телефоне? У той же Apple для "hey siri" отдельный чип, который позволяет телефонам реагировать только на одну фразу и не жрать батарейку постоянно.

Ответить
Развернуть ветку
денькя

Ну тем более, если есть чип который 100% времени слушает "hey siri", почему бы еще не договорится с Apple насчет фраз "купить что-то", "продать что-то", "заказать что-то" и т.д.
После этих ключевых фраз включается уже более сильный алгоритм, аналогично как с "hey siri", после этой фразы данные уже обрабатываются более серьезным алгоритмом на сервере Apple.

Ответить
Развернуть ветку
Nikita

Ну да, ну да. Apple ведь так насрать, что ради непонятной выгоды она будет рисковать репутацией и давать facebook возможность прослушивать себя.

Ответить
Развернуть ветку
денькя

Ну это единственный аргумент с которым я отчасти соглашусь.

С другой стороны если Apple/Facebook/etc договариваются о том что бы не переманивать сотрудников друг друга, то почему они не могут договорится о закрытом API для прослушки, если это приносит довольно много денег и откаты могут быть существенные.

Тем более китайцы давно уже активно всех прослушивают, не думаю что Apple будет тут терять конкурентное преимущество. Тем более не обязательно заключать официально соглашение, можно просто "слить" доступ к закрытому API, и в случае шухера обвинить Facebook в эксплуатации уязвимости.

Я лично не верю, что корпорации имея техническую возможность прослушивать своих пользователей будут руководствоваться соображениями морали и нравственности, а не желанием максимизировать прибыль.

Ответить
Развернуть ветку
Nikita

Мораль и нравственность тут не при чем, речь о репутации. Кроме того, закон почти любой страны запрещает прослушку. Вы представляете какие могут быть юридические последствия?

Ответить
Развернуть ветку
денькя

Да никаких юридических последствий не будет.
Майкрософт же ловили на том что они сохраняются пароли и их краулеры пользуются паролями для входа на закрытые веб-сайты)

Ответить
Развернуть ветку
Nikita
они сохраняются пароли

Что? Покажите законы, которые бы запрещали сохранять пароли. А законы о запрете прослушки есть и это уголовка.

Ответить
Развернуть ветку
денькя

Да это одно и тоже) нет принципиальной разницы - прослушивать вашу речь или прослушивать то что вы набираете на клавиатуре.

При этом запрещена "незаконная прослушка", а если пользователь согласен на "обработку медиаданных для улучшения поиска и повышения качества контекстной рекламы", то в чем нарушение?

Ну т.е. облечь в нужную юридическую форму, слить какие-то данные силовикам и все - репутационные издержки улажены.

Ответить
Развернуть ветку
Nikita
нет принципиальной разницы

Разница есть.

При этом запрещена "незаконная прослушка", а если пользователь согласен на "обработку медиаданных для улучшения поиска и повышения качества контекстной рекламы", то в чем нарушение?

В том, что в такой интерпретации, почти любая прослушка законна.

репутационные издержки улажены.

Репутационные издержки и силовики - это разные проблемы.

Ответить
Развернуть ветку
Михаил Муромов

А кто-нибудь из корпораций-гигантов или ихних боссов за последние лет 5 пострадал за прослушку? Кого-нибудь уволили, оштрафовали, посадили? Я что-то не могу сходу вспомнить

Ответить
Развернуть ветку
Nikita

А где-то уже были найдены случаи массовой прослушки какой-то корпорацией?

Ответить
Развернуть ветку
Михаил Муромов

Именно таких случаев не могу вспомнить сразу. Обычно на этом всякие спецслужбы палятся. Впрочем, не упомню, что бы и там кого-то хоть как-то наказали. Корпорации пока что палятся на слежке. Типа как Гугл следил за андроид-юзерами, даже при всех отключенных GPS.

Да и в целом как-то странно: скандалы со сливом данных, слежкой и прочими прайваси-факапами происходят регулярно, но я не могу вспомнить НИ ОДНОГО случая, когда за это кто-нибудь реально бы пострадал. Не в смысле «Ой, Кембридж аналитика, удар по репутации, потеря капитализации» и прочей довольно виртуальной фигни, а когда конкретно кого-то оштрафовали или посадили

Ответить
Развернуть ветку
денькя

Ну это уже тонкости. Если вернуться к теме статьи, то техническая возможность обрабатывать речь, дергать ключевые слова и отправлять куда-то существует. В iPhone есть чип для обработки речи, у Android'ов стоят крутые ARM'ы с сопроцессорами для DSP, AI и энергосберегающим режимом.

Есть только организационные и юридические ограничения.

Ответить
Развернуть ветку
Nikita

ТЗ такие ТЗ.

Если вернуться к теме статьи, то техническая возможность обрабатывать речь, дергать ключевые слова и отправлять куда-то существует.

Конечно существует, только не долго, потому что проц нагреется и сожрет все питание. См. мое первое сообщение.

В iPhone есть чип для обработки речи

Который постоянно слушает только "hey siri".

Есть только организационные и юридические ограничения.

Ну да, это ведь такая мелочь.

Ответить
Развернуть ветку
денькя

Да ничо он не сожрёт) Я просто занимаюсь обработкой звука, и даже на iPhone в бородатом 2010 году можно было юзать специальный чип для DSP доступ к которому идет через библиотеку Accelerator который позволял слушать и анализировать звук тратя 5% энергии. Ну т.е. это хватало на много часов работы. Сейчас это еще проще делать. Конечно, Apple уведомляет о записи звука, показывая зелёненькую полоску. Но вполне допускаю что крупные компании, типа Facebook вполне могут это делать втихую.

Ответить
Развернуть ветку
денькя

К тому же, например, я пользуюсь Apple Watch и заряда хватает только на 24 часа. Хотя аналогичные часики от Huawei держат заряд 7 дней. Вопрос - куда жрется энергия? Функционал примерно одинаков.

Ответить
Развернуть ветку
Nikita

У Apple всегда были слабые аккумуляторы в мобильных и носимых устройствах.

Ответить
Развернуть ветку
Nikita
даже на iPhone в бородатом 2010 году можно было юзать специальный чип для DSP доступ к которому идет через библиотеку Accelerator который позволял слушать и анализировать звук тратя 5% энергии

Смотря как анализировать. Если речь об FFT, то конечно много энергии не надо, хотя и это может съесть батарейку за 2-3 часа. Но FFT это далеко не распознавание речи.

Ответить
Развернуть ветку
денькя

Конечно, но нейросети прожорливы только при обучении и подстройке. Когда они работают в режиме распознавания, то это просто перемножение с весовыми коэффициентами и суммирование. Для распознования "hey siri" используется вектор длиной в 13 отсчетов. Т.е. это очень простая нейронка.

Так что нет технической проблемы в том что бы кроме "hey siri" распознавать и пару десятков других ключевых слов нужных для маркетинга, а потом запускать уже полноценный прожорливый алгоритм.

Ответить
Развернуть ветку
130 комментариев
Раскрывать всегда