«Яндекс» запустил тестовое распознавание отдельных голосов в колонках с «Алисой» Статьи редакции
Пока помощник может узнавать только одного человека.
В «умных» колонках с голосовым помощником «Алиса» появилось тестовая функция распознавания людей по голосу, рассказали vc.ru в «Яндексе» .
Чтобы записать свой голос, нужно сказать помощнику «Алиса, запомни мой голос» или «Давай познакомимся». На момент начала тестирования «Алиса» может записать только одного человека и отличать его от других.
К человеку, который записал свой голос, «Алиса» будет обращаться по имени, запоминать его музыкальные предпочтения и подбирать песни специально для него. В будущем «Яндекс» планирует добавить распознавание нескольких голосов по отдельности, дата запуска этой функции пока неизвестна.
7165
просмотров
Как по мне, то любая умная колонка с голосовым помощником - это добровольно установленное внутри помещения прослушивающее устройство.
А ноут с вебкамерой - добровольно установленное устройство видеозаписи. А телефон с GPS - устройство слежения
Камера и микрофон на ноуте принудительно отключается.
Использование умной колонки подразумевает постоянное подключение к интернету для анализа голосовых запросов и работы голосового помощника.
Не надо включать заезженный троллинг про паранойю, это глупо.
На Станции есть кнопка, физически отключающая микрофоны. Такая есть на вашем ноуте?
Яндекс.Станция появилась уже год назад. И никто пока не взял какой-нибудь Wireshark и не доказал, что она посылает в сеть что-нибудь кроме голоса после активационного слова. Только однообразные шутки про товарища майора, которому почему-то очень интересно, какую музыку я предпочитаю.
Так что это именно свист и паранойя уровня шапочек из фольги. Причем паранойя негодная, так как параноики почему-то не спешат выбрасывать свои ноутбуки и смартфоны — постоянно подключенные к интернету устройства с GPS, микрофонами и видеокамерами, содержащие уйму информации об их владельцах — но очень боятся, что кто-то будет слушать их разговоры перед телевизором.
Ну на Яндекс.Станции можно выключить принудительно микрофон прям разомкнув цепь. Ну т вас никто же не заставляет себе колонку покупать и использовать.
На самом деле можно было бы придумать техническое решение, что запись на микрофон будет осуществляться только после фразы "Слушай, Алиса". Но кому это нужно.
Ну а как без записи и постоянного прослушивания она должна понять, что к ней обратились?
Нейросеть обучена на фразу "Слушай, Алиса" и работает на стороне устройства, без обращение на внешний сервер.
Когда устройство опознает фразу-обращение, оно уже передает запрос в яндекс, где его обрабатывают и возращают колонке.
Оно именно так и работает. Все колонки имеют небольшой контроллер не подключённый к основной soc. Он распознаёт обращение. Называется эта штука споттер.
Нейросеть вроде как не в самой колонке находится...
Следовательно, стартовую фразу распознаёт само устройство, а всё что после, идёт на сервер.
Если так, то всё, что мы тут обсуждаем - пустая болтовня без знания фактов.
Нейросеть, которая распознает фразу "Слушай, Алиса" находится в самой колонке, конечно же.
И это работает крайне плохо, тут уже были новости, что у Siri отправляются на анализ даже записи про покупку наркотиков, занятия сексом, итд
Эмм, я боюсь спросить, а как она без микрофона узнает что эту фразу сказали? Ну и все голосовые помощники двигаются к очеловечиванию и им нужно уметь из контекста понимать что обращаются к ним.
Микрофон то будет, куда он денется. Но записывать и отправлять на сервер только после кодовой фразы. Ну это просто как мысль, что технически такое возможно думаю. Про очеловечивание да, соглашусь, круто было бы как с живым человеком общаться, а не начиная с кодовой фразы. Но вот есть обратная сторона медали.
Оно ровно так и работает, инфа 100%. У меня был опыт реверс-инженеринга некоторых из устройств.
А что мы тогда так переживаем, что нас записывают все время?)
Речь не о том, что колонку не стоит покупать, а о самом факте того, что по принципу своей работы она по сути является дистанционным прослушивающим устройством.
Это просто информация к сведению и рассуждению.
Так можно было бы сказать, если бы колонка посылала на сервер весь звук, а не только короткие отрывки после активационной фразы. А так это не в большей степени шпионское устройство, чем смартфон, ноут или телевизор со звуковым управлением.
Комментарий удален модератором
Какое-нибудь приложение действительно может в теории (но это не точно) куда-то передавать данные с камеры. Ну не ставьте всякие подозрительные приложения. Колонка 100% передает все что слышит, хранит записи только по закону яровой несколько месяцев, а скорее всего вечно, плюс к этому весь голос переводится в текст и тоже наверняка хранится вечно и проверяется как-минмум на ключевые слова кем надо.
Посчитайте сколько надо ресурсов гуглу и яндексу, чтобы ВСЮ речь 24\7 миллионов пользователей записывать, передавать себе, расшифровывать и хранить.
Так она и так это делает, чтобы "алиса" как-то реагировала на вход она должна получить текст, этот текст она получает из голоса, который передает колонка на серверы яндекса. Из этого можно сделать вывод что все, что слышит колонка записывается и превращается в текст и, очевидно, никогда не удаляется.
На счет того, что все колонки генерят так много аудио и текста, что надо очень много дисков чтобы это хранить, то это ерунда. Во-первых не так и много, текст почти ничего не весит, а голос можно сильно сжать. Во-вторых ценность этой информации намного больше стоимости самих дисков. Представь что у тебя есть поток расшифровок разговоров на кухне в стране Россия. Даже боюсь начать фантазировать как это можно использовать.
Если данные никогда не удаляются, то где все эти эксабайты хранить? Сколько мощностей на это надо, сложно представить
так выделяют из бюджета же
у вас богатое воображение и нулевое представление о технической части умных колонок.
Ни один сервер не сможет обрабатывать столько голосовой информации, чтобы передавать и анализировать все, что вы говорите в помещении (т.к. таких помещении сотни тысяч). Попробуйте для начала в математику и аналитику, а потом паранойте.
Если вами заинтересуется контролирующие структуры, то вас легко вычислят и без колонок и ноутбуков, не переживайте.
*стандартный комментарий под подобными новостями
И ведь не надоедает...
Кому ты нахрен нужен?)))
Параноики негодуют
“Если у вас нет паранойи, - это не значит, что за вами не следят” (с)
Параноики, такую вещь в дом и близко не подпустят.
Фольгированные шапочки, быстро, качественно, недорого.
Если надеть это на колонку, думаю будет слышно в разы плохо.
Это, как мне кажется, первейшая функция ассистентов - во всех рекламах у Яндекса колонкой пользуются несколько человек.
Комментарий удален модератором
И мы все его знаем.
А Siri по-прежнему не может.
Это офигенски круто...
Я уже подумал забросили колонку, ни одного существенного апдейта за полгода. Все разрабы ушли в сбер?
По техзаданию товарища майора обновление прибыло.
Надо так:
Алиса, запомни мой голос: гаф гаф!
А то товарищ майор жаловался, что записи без фамилий.
какая то сомнительная по пользе функция
Попробовал, функция появилась. Запоминает имя и для обучения просит назвать несколько фраз.
Так как колонка слушает всё, то "товарищ майор" был бы в шоке от разговоров из фильмов "Крепкий Орешек" и пр. Там постоянно борьба с террористами и охота за президентом. Так что паранойя не выдерживает никакой критики. А прослушка тех, кто смотрит "клубничку" вообще должна повергнуть чекиста в уныние...