Невероятное совпадение или сказ о том, как большой брат следит за тобой
Знаете все эти истории про то, как ваш знакомый (или вы) общались о стиральных машинах, а потом вся реклама забита предложениями купить стиралку?
Недавно со мной произошла похожая история.
В субботу вечером, после просмотра новой Матрицы, решил я вспомнить: «как было раньше?». И пошел на ютуб смотреть моменты.
Клацая по рекомендациям, в какой-то момент зацепляюсь глазом за рекомендацию фильма «Замерзшая из Майями». Забавное название, подумал я, смотреть я, конечно, не буду.
Но каково же было мое удивление сегодня, когда я просматривал материал для монтажа от работодателя: в записанном видео этот фильм приводился как пример. Материал был записан в пятницу, т.е. сутками ранее.
Видео писалось на iphone. Звук на отдельный рекодер. Любые другие устройства были выключены.
Я залогинен в Youtube аккаунте работодателя в отдельном браузере.
Видео смотрел с другого браузера и аккаунта. Т.е. путь, как меня связал google вполне ясен, он видит, что с одного компьютера залогинены два аккаунта и связывает их.
НО. Откуда он узнал про фильм? Apple прослушивает и скидывает все гуглу. Что он слушает? Весь поток речи или записанное видео?
В совпадение в данном случае точно не верю, рекомендация такого фильма сильно выбивается из того, чему я приучил youtube мне рекомендовать.
Все действия отслеживаются и анализируются, потом подсовывают актуальную рекламу. Ты кликаешь, они зарабатывают. Все записывается в зашифрованном виде, как только ты начинаешь предоставлять интерес, шифрование снимается и тебя крутят по полной.
Как это сделал бы я… Понятно, что смартфоны не распознают всю речь локально, большей частью обработка идёт на внешних серверах. Следовательно, весь голосовой поток скидывать туда без разрешения пользователя несколько сцыкотно - будет слишком заметно по объемам трафика.
Напрашивается формирование внутренней базы из нескольких десятков или сотен ключевых слов и мониторинг силами самого смарта входящего голосового потока постоянно. А вот при распознавании ключевого слова рекламодателям скидывается инфа типа IMEI такой-то упоминал термин 235, вероятно он релевантен вашему продукту. Формально все кошерно, информация пользователя передаётся в зашифрованном виде, причём передаётся только интерес, а не полный голосовой поток.
Но учитывая, что государство может вежливо попросить производителя ОС включить в базу слова имеющие по их мнению отношение к безопасности и при их наличии обязать писать и передавать весь поток, то становится более понятной назойливая забота о присутствии на смартах отечественных одобренных приложений имеющих доступ к микрофону.
Если до этого так легко додуматься, то шансов что это так и реализовано - примерно 100%
Это 100%. Я два раза с разницей в месяц по айфону обсуждал крупную сумму денег и после каждого раза на ютубе неделю меня догоняла реклама финансовых инфоцыган.
НО. Этот фильм явно не мог быть в ключевых словах. И вот это уже немного беспокоит.
Тут все ещё проще. Клацая по рекомендациям вы попали в паттерн пользователей которые после этого интересовались и «Замёрзшей в Майами». То что вы сами не кликнули - неважно, важно что это до вас сделали процентов 80 юзеров со схожим паттерном действий до этого.
Слабое объяснение. Ну никак просмотр моментов из матрицы не мог рекомендовать мне посмотреть платно фильм «Замёрзшей в Майами». Вообще. Это паттерны из разных миров.
"Apple прослушивает и скидывает все гуглу. Что он слушает? Весь поток речи или записанное видео?"
не только речь и видео, но еще данные с клавиатуры и камеры. И чье-то там согласие им не особо нужно.
Но как? Ведь это не маленький объем трафика. Его бы уже спалили.
Это же не данные о QR-кодах граждан, которые охраняют два недопрограммиста за 35000 в месяц.
Эти данные имеют серьезную коммерческую ценность. Я так думаю, она измеряется десятизначными цифрами и не в рублях)
Палятся систематически и иногда нелепо. Я как-то с другом на кухне обсуждал поршневые кольца. Меня видимо не так поняли, и потом гоняли рекламу ювелирки "купить кольца"))
Я говорю про объем трафика, который нужно передавать. Он должен быть весьма заметным.
передается же не голос, а грубо говоря - текстовая стенограмма разговора в зашифрованном виде. Много ты с телефоном разговариваешь?
Ну да, съемочный день - это 20 гигабайт видео.
У меня тоже было примерно похожее, со знакомым общался о одной теме, на следующее утро сёрфлю интернет и это мне попадается в рекламе
хотя до этого никогда не попадалось
матрица лагает