7 янв 2019 7.01.2019

Фото: Apple подчеркнула, что не продаёт данные пользователей — «в отличие от конкурентов» Статьи редакции

Компания разместила наружную рекламу напротив места проведения конференции, в которой участвуют Google и Amazon.

7 января 2019 года, за день до конференции Consumer Technology Association в Лаc-Вегасе, Apple разместила напротив места проведения мероприятия наружную рекламу с изображением своего смартфона, подписью: «Всё, что происходит в iPhone, остаётся в iPhone» и ссылкой, ведущей в раздел безопасности данных компании.

Так бренд показал, что в отличие от конкурентов не продаёт данные пользователей, считает издание CNBC: «Amazon и Google всё равно на конфиденциальность данных».

Также бренд обыграл в надписи известное в США выражение: «Всё, что произошло в Вегасе, остаётся в Вегасе».

#фото #apple

1 показ

6.8K открытий

85 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

iLeonidze

7.01.2019

Повод вспомнить конспирологов, плодящих теорию заговора о подслушивающих айфонах, и показывающих им в яндексе рекламу квартир в Мытищах

Ответить

Развернуть ветку

Аккаунт удален

7.01.2019

Комментарий недоступен

Ответить

Развернуть ветку

iLeonidze

7.01.2019

Ну вы сами подумайте, если ваш телефон будет вас слушать и отправлять данные 24/7, наверное у вас и аккумулятор будет улетать, и гигабайты интернета будут внезапно кончаться?
И, поверьте, исследователей, желающих вывести Apple и Google на чистую воду и заработать на исках миллионы долларов - полно. И все они под микроскопом изучают что же там устройства отправляют по сети на свои сервера. И удивительно, за столько времени, сколько длится эта истерия, ничего не нашли!

Ответить

Развернуть ветку

Aleksey Goncharov

7.01.2019

Постоянно могут слушают без особого ущерба для батарейки и это факт. Что Iphone, что андроид когда вы прозносите ключевое слово - сразу активируются (эй, сири или ок гугл). Соответственно, слушать нужно постоянно. Даже если вы отключите ассистенты.
Трафика много не нужно тк современные смартфоны без особых проблем преобразуют голос в текст.
Отправленные килобайты текста в трафике смартфона заметить сложно.

В на фото, например то, что мой айфон напередовал в apple за 2 месяца владения телефоном (и это только мобильная сеть).
Затерять в этих сотнях мегабайт и гигабайтах все ваши разговоры даже за год - не проблема. Тем более в зашифрованном виде.

Ответить

Развернуть ветку

iLeonidze

7.01.2019

Про ключевое слово. Вы правы, да, в телефонах есть такой режим, когда они реагируют на вызов голосового помощника. Однако, там не работает Voice Recognition, а происходит обработка сигналов с микрофона энергоэффективным паттерном. Именно поэтому вы можете вызывать гугл лишь одной командо «Эй, гугл», а не любой, какой вам захочется.
И когда вы говорите, что у технологических гигантов, есть «черная коробка» которая реагирует на N мистических ключевых слов - это звучит очень не убедительно. Ну хорошо, например, есть ключевое слово «квартира». Я это слово в день могу употребить раз 20. При этом 0 из 20, будут на тему покупки или ремонта квартиры. А теперь представим что этих ключевых слов 1,000. И все они будут ложно-положительно срабатывать, потому что максимум темы, которые я буду обсуждать, которые будут интересно рекламодателям - это какое молоко я сегодня вечером куплю. Очевидно, что продавать молоко мне в интернете никто не будет, а значит и смысла в так называемом «черном ящике», который «магически» реагирует на определенные темы - нет.

Ответить

Развернуть ветку

Michael Smith

7.01.2019

Однако, там не работает Voice Recognition, а происходит обработка сигналов с микрофона энергоэффективным паттерном

Это ваше предположение или это где-то описано?
И сомневаюсь, что есть большая разница в потреблении для движка, будет он распознавать одну фразу или несколько сотен ключевых слов для рекламы.

Ответить

Развернуть ветку

Shoo

8.01.2019

Разница есть.

Ответить

Развернуть ветку

Michael Smith

8.01.2019

Вряд ли существенная, на фоне всех остальных приложений.
5 минут емкости батареи никто не заметит.

Ответить

Развернуть ветку

Shoo

8.01.2019

Сложность вычислений, а как результат и их скорость и ресурсоемкость, при добавлении новых фраз в модель распознавания растет даже не линейно.
Как минимум потому, что при большем обьеме возможных исходов распознавания требования к точности очень сильно отличаются.
Добавляется контекстность и прочее.
Не говоря уже о том, что сама модель будет отжирать приличное количество места на девайсе.

В общем нет, речь не о 5% зарядки, а скорее о том, что б всадить аккум айфона со 100% в 0 за час-другой работы.

Ответить

Развернуть ветку

Michael Smith

8.01.2019

Ок, пишем звук, пакуем и отправляем на сервер, когда тел в сети, на сервере все и распознается, делов-то )
Такие операции на батарее практически не отразятся, а для таргетирования рекламы задержка не критична, риалтайм тут не нужен.

Ответить

Развернуть ветку

Shoo

8.01.2019

Они очень хорошо отразятся и на батарее, и на трафике, и на памяти девайса.
Можете почитать давнешнюю историю про отправку я.навигатором звука с девайса.
Там довольно наглядно проиллюстрировано насколько это чувствуется.

Ответить

Развернуть ветку

Michael Smith

8.01.2019

Отразятся, но не очень.
Звук не надо писать все время, только при его наличии, упаковка речи дешевая операция, степень сжатия высокая (у речи небольшой частотный диапазон), объем там получается незаметный при современных объемах памяти и трафика.

Например обычный цифровой диктофон пишет 1165 часов (48 дней) в память 8 гигов. Нам хватит буфера в 2-3 часа, это всего лишь пара десятков мегабайт.

Ответить

Развернуть ветку

Shoo

8.01.2019

Я повторюсь: возьмите историю с я.навигатором и почитайте, как это выглядит в реальной жизни.
Это так не работает.
Кажется тот факт, что ни один из существующих войсассистентов не работает по такому сценарию наглядно демонстрирует нежизнеспособность подобной идеи.
Очень просто строить теории, если не знаешь, как это работает на практике. А потом печальные жизненные реалии все портят.

Ответить

Развернуть ветку

Michael Smith

9.01.2019

Кажется тот факт, что ни один из существующих войсассистентов не работает по такому сценарию

Разумеется не работает, войсассистент должен работать в риалтайме. Для таргетирования рекламы это не нужно, я про это уже написал выше.

просто строить теории, если не знаешь, как это работает на практике

Цифровые диктофоны это как раз практика из этой области )
нету там больших объемов, которыми вы пугаете

Ответить

Развернуть ветку

Shoo

9.01.2019

Ну окей, вам, конечно, виднее. Цифровые микрофоны это ж почти айфон.
/facepalm

Ответить

Развернуть ветку

Michael Smith

9.01.2019

вам, конечно, виднее

Ну явно я не вас буду слушать, после ваших страшных историй, что пара десятков мегабайт это ого-го какой трафик и расход памяти и это невозможно переслать, потому что "верьте мне".

Ответить

Развернуть ветку

iLeonidze

11.01.2019

Предположим что речь передается с минимальным для распознавания битрейтом в 8 кбит/с. Вот пруф https://ru.m.wikipedia.org/wiki/Битрейт читайте. Давайте позанимаемся математикой теперь.
8 кбит/с = 1 кбайт/с. За 1 минуту потребуется 60 килобайт, за 1 час 360 килобайт, за 24 часа 8640. То есть примерно 8 мегабайт. Но мы то помним что нас слушают 24/7. В среднем в месяце 30 дней. Значит в месяц для передачи всех наших разговоров потребуется 259 мегабайт. В принципе, это весьма серьезный объем, если учесть что мы сейчас говорим про очень-очень плохое качество звука, и на практике скорее всего битрейт на уровне 32 килобит, то есть в месяц будет расходоваться «кудато» 1 гигабайт интернета.
А теперь давайте посчитаем сколько это будет стоить, чтобы оцифровывать такие объемы данных. В году 525600 минут. Теперь посмотрим сколько стоит распознавание в минуту, далеко ходить не надо https://cloud.google.com/speech-to-text/pricing
Предположим что гугл предоставляет свои мощности с большой скидкой, например 50%. Значит в минуту стоимость распознавания стоит $0.003. Погнали, 525600*0.003=$1576 на распознавание ваших персональных разговоров в год. Уверен, что рекламодатели не очень заинтересованы вашей персоной, чтобы тратить на вас такие деньги. Ок, предположим что мы слушаем 1,000,000 айфонов по всей россии. Для распознавания таких объемов данных придется потратить 1 миллиард долларов в год. Многовато, не находите ли, с учетом того, что мы взяли абстрактный миллион (а устройств гораздо-гораздо больше)?

Ответить

Развернуть ветку

Michael Smith

11.01.2019

Вы хоть читайте тред сначала, все уже посчитано
https://vc.ru/marketing/54915-foto-apple-podcherknula-chto-ne-prodaet-dannye-polzovateley-v-otlichie-ot-konkurentov?comment=1025041

Ответить

Развернуть ветку

iLeonidze

11.01.2019

А вы читайте то, что вам говорят с приведенными расчетами и доказательствами и не несите ерунды. Никакая компания в здравом уме не будет тратить миллиарды на прослушку речи своих пользователей, рискуя при этом своей собственной репутацией, лишь бы впарить вам китайский пылесос и получить с этого три копейки.

Ответить

Развернуть ветку

Michael Smith

11.01.2019

Ерунду несете вы. Гугл читает личную переписку в почте для таргетинга рекламы и риски для репутации его почему-то тут не волнуют, а вот распознавание голоса для таких же целей его сразу же вдруг волновать начнет )

Гугл записывал уличный wi-fi трафик, пока его не поймали на этом.
Весь Wi-Fi трафик Карл! Задолго до Яровой! Вот уж где петабайты и миллиарды, а вы мне тут про какие-то мегабайты втираете, что Гугл не захочет их хранить.

Ответить

Развернуть ветку

Michael Smith

9.01.2019

ни один из существующих войсассистентов не работает по такому сценарию

Кстати, а ведь про Siri пишут, что она как раз работает server-side. Врут? :)
https://possiblemobile.com/2016/09/speech-recognition-core-data-ios-10/
https://medium.com/@vaibhavplus/comparison-of-various-speech-to-text-system-c2b8afce9ab6

Apple introduced a new Speech Recognition API that allows us to tap into the server-side speech-processing capabilities that power Siri

Ответить

Развернуть ветку

Shoo

9.01.2019

Сири работает серверсайд, все так.
Как это работает? Вы активируете сири, и запрос уходит в серверсайд.
Активация происходит локально.
Ничего нового.
Кажется это совсем другая история чем слать весь звук вообще.

Ответить

Развернуть ветку

Michael Smith

9.01.2019

Вы же только что писали, что ни один ассистант не использует такой сценарий работы (не отсылает данные для распознавания на сервере).

Ответить

Развернуть ветку

Shoo

9.01.2019

Не один войсассистант не отсылает весь звук на сервер.
Потому что это ад и боль.
Это всегда минимальная локальная модель активации и полноценный asr на сервере.
Слать 5 секунд звука после детекта фразы активации и писать любые шумы прогоняя их через asr - совсем разные вещи, не находите?

Ответить

Развернуть ветку

Michael Smith

9.01.2019

Слать 5 секунд звука после детекта фразы активации и писать любые шумы прогоняя их через asr - совсем разные вещи, не находите?

я не вижу никакой проблемы отправить 20 мегабайт раз в 3 часа (и это при постоянном звуке рядом, что бывает редко), если для вас это технологически невозможно, ну чтож

Ответить

Развернуть ветку

Shoo

9.01.2019

Окай. Рад, что в вашем мире всё так просто.
Приезжайте на следующие voicetech конфы, расскажете ребяткам как надо.
А то посоны там терабайты места тратят, глупости всякие городят. :)

Ответить

Развернуть ветку

Michael Smith

9.01.2019

Очень хорошо, что производители диктофонов туда не ходят, а то бы мир остался без диктофонов, ведь им бы тогда были нужны террабайты для записи речи хД

Извините, но я технарь и для меня авторитеты пустой звук, вы не сказали ни одной реальной технической причины почему это не возможно (пугание трафиком в 20 мегабайт не в счет), только пяткой в грудь бьете.

Ответить

Развернуть ветку

Shoo

9.01.2019

Если вы не технарь, то зачем, собственно, строить предположения о том, как сделать что-то, работу чего вы не понимаете?
Это здорово придумать цифру из головы и плясать от нее, но увы.
Берете любой открытый датасет голосов, пригодный для обучения asr и смотрите соотношение звука с весом. Есть, например, common voice от мозиллы.
Спойлер: цифра будет сильно отличаться от 20мб на 3 часа звука.
А пока что это все больше похоже на пресловутое "а у меня племянник троюродной тети такое за 10 тыщ сделает".

Ответить

Развернуть ветку

Michael Smith

9.01.2019

А пока что это все больше похоже на пресловутое "а у меня племянник троюродной тети такое за 10 тыщ сделает".

Ну раз сами вы никакими цифрами не владеете, только страшными байками про терабайты, то вот, немного погуглил для вас.

В API для Google Cloud Speech как один из возможных форматов указан AMR 8kHz.
Максимальный(!) битрейт для этого формата 12.20 kbit/s.
Итого 3 часа непрерывной записи в этом формате весят максимум 16 мегабайт. Что и требовалось доказать.

Ответить

Развернуть ветку

Michael Smith

9.01.2019

Берете любой открытый датасет голосов, пригодный для обучения asr и смотрите соотношение звука с весом. Есть, например, common voice от мозиллы.

Вы про сжатие никогда ничего не слышали?
Попробуйте хотя бы винраром сжать wav файл, спойлер: размер сильно изменится.

Ответить

Развернуть ветку

Michael Smith

9.01.2019

Ага, посмотрел, это там где датасеты из wav файлы сжаты алгоритмом упаковки tar и gz? Gzip для непожатого звука, для звука, Карл!
И вы это приводите как пример хорошей упаковки звука?
Ну, тут даже и разговаривать дальше не о чем. 🤦

Ответить

Развернуть ветку

iLeonidze

11.01.2019

Хорошо, вы говорите про частотный диапазон. Теперь проведите эксперимент, вот прямо сейчас. Возьмите ваш диктофон, тот самый, который старенький такой, а не современный телефон, включите запись, положите его к себе в карман штанов, выйдите на улицу и поговорите там с кем-нибудь. А потом послушайте и вы удивитесь - ничего не слышно! И более того, вы предлагаете сильное урезание частотного диапазона, что означает что речь издалека просто даже не войдет в него, ввиду ее искажений на расстоянии.

Ответить

Развернуть ветку

Michael Smith

11.01.2019

А потом послушайте и вы удивитесь - ничего не слышно! И более того, вы предлагаете сильное урезание частотного диапазона, что означает что речь издалека просто даже не войдет в него, ввиду ее искажений на расстоянии.

Извините, но это ерунда, частотный диапазон речи 200-3400 Гц и он с растоянием никак не меняется конечно.
Я выше посчитал сжатие речи в формате AMR 8kHz (16 МБ на 3 часа), этот формат специально придумали для сжатия речи в диапазоне 200–3400 Гц и он используется в GSM стандарте.
Если хотите поспорить про изменения тона, то включите громкую связь на телефоне и позвоните кому-нибудь, ваш собеседник вас слышит, хотя вы говорите с расстояния 1-2 метра? Конечно слышит. Хотя GSM передает только 200-3400 Гц.
Значит ничто не мешает приложению так же слушать микрофон и писать разговоры вокруг в тот же формат и с той же компрессией как в GSM.

Ответить

Развернуть ветку

iLeonidze

11.01.2019

Я вам про лес, а вы мне про дрова.
Кодек, о котором выговорите, имеет битрейт 12,2 кбит/с, низковатое качество для распознавания в трудных условиях окружающих шумов.
Дальше вы пытаетесь подменить понятие. Собеседник будет меня слышать хорошо на громкой связи при условии того, что я буду говорить достаточно громко, а также при идеальной тишине. Более 75% своего времени, когда человек не спит, его окружает шум - улица, офис, шумящий телевизор дома или магнитола в машине. То есть прослушивая вас, лишь 5-10% вашего времени были бы эффективны. А если я еще учту что мы говорим не 100% своего времени, а лишь 5-10%...
Более того, вы совершенно не разбираетесь как работает современный телеком. Никто вам не передает аудио с битрейтом 1999-го года. Сейчас повсеместно используется VoLTE, потребляющий от 23 до 48 кбит/с, больше ваших предложений в 2-4 раза.

Ответить

Развернуть ветку

Michael Smith

11.01.2019

Более 75% своего времени, когда человек не спит, его окружает шум - улица, офис, шумящий телевизор дома или магнитола в машине. То есть прослушивая вас, лишь 5-10% вашего времени были бы эффективны.

Фильтр частот для речи как раз и отрезает большинство шума.
И у нас не стоит задача распознавания 100% всех слов. Любой процент уже будет хорошо и даст данные для обучения сетки и таргетинга.

Никто вам не передает аудио с битрейтом 1999-го года.

Мне достаточно, что Google Speech-to-Text в 2019 работает с этим форматом и битрейтом, значит им этого для распознавания речи хватает.

Ответить

Развернуть ветку

Показать 85 комментариев . Вы видите только часть дискуссии

Написать комментарий...

82 комментария

Раскрывать всегда