«Яндекс» запустил тестовое распознавание отдельных голосов в колонках с «Алисой» Материал редакции

Пока помощник может узнавать только одного человека.

В закладки

В «умных» колонках с голосовым помощником «Алиса» появилось тестовая функция распознавания людей по голосу, рассказали vc.ru в «Яндексе» .

Чтобы записать свой голос, нужно сказать помощнику «Алиса, запомни мой голос» или «Давай познакомимся». На момент начала тестирования «Алиса» может записать только одного человека и отличать его от других.

К человеку, который записал свой голос, «Алиса» будет обращаться по имени, запоминать его музыкальные предпочтения и подбирать песни специально для него. В будущем «Яндекс» планирует добавить распознавание нескольких голосов по отдельности, дата запуска этой функции пока неизвестна.

теперь расскажите, почему всё это работать не будет
{ "author_name": "Андрей Фролов", "author_type": "editor", "tags": ["\u044f\u043d\u0434\u0435\u043a\u0441","\u043d\u043e\u0432\u043e\u0441\u0442\u044c","\u043d\u043e\u0432\u043e\u0441\u0442\u0438","\u0430\u043b\u0438\u0441\u0430"], "comments": 43, "likes": 23, "favorites": 7, "is_advertisement": false, "subsite_label": "services", "id": 84203, "is_wide": true, "is_ugc": false, "date": "Mon, 23 Sep 2019 11:22:39 +0300", "is_special": false }
Объявление на vc.ru
0
43 комментария
Популярные
По порядку
Написать комментарий...
4

Как по мне, то любая умная колонка с голосовым помощником - это добровольно установленное внутри помещения прослушивающее устройство.

Ответить
13

А ноут с вебкамерой - добровольно установленное устройство видеозаписи. А телефон с GPS - устройство слежения

Ответить
7

Камера и микрофон на ноуте принудительно отключается.

Использование умной колонки подразумевает постоянное подключение к интернету для анализа голосовых запросов и работы голосового помощника.

Не надо включать заезженный троллинг про паранойю, это глупо.

Ответить
5

Камера и микрофон на ноуте принудительно отключается.  

На Станции есть кнопка, физически отключающая микрофоны. Такая есть на вашем ноуте?

Яндекс.Станция появилась уже год назад. И никто пока не взял какой-нибудь Wireshark и не доказал, что она посылает в сеть что-нибудь кроме голоса после активационного слова. Только однообразные шутки про товарища майора, которому почему-то очень интересно, какую музыку я предпочитаю.

Так что это именно свист и паранойя уровня шапочек из фольги. Причем паранойя негодная, так как параноики почему-то не спешат выбрасывать свои ноутбуки и смартфоны — постоянно подключенные к интернету устройства с GPS, микрофонами и видеокамерами, содержащие уйму информации об их владельцах — но очень боятся, что кто-то будет слушать их разговоры перед телевизором.

Ответить
2

Ну на Яндекс.Станции можно выключить принудительно микрофон прям разомкнув цепь. Ну т вас никто же не заставляет себе колонку покупать и использовать.

Ответить
0

На самом деле можно было бы придумать техническое решение, что запись на микрофон будет осуществляться только после фразы "Слушай, Алиса". Но кому это нужно.

Ответить
5

Ну а как без записи и постоянного прослушивания она должна понять, что к ней обратились?

Ответить
–1

Нейросеть обучена на фразу "Слушай, Алиса" и работает на стороне устройства, без обращение на внешний сервер.

Когда устройство опознает фразу-обращение, оно уже передает запрос в яндекс, где его обрабатывают и возращают колонке.

Ответить
3

Оно именно так и работает. Все колонки имеют небольшой контроллер не подключённый к основной soc. Он распознаёт обращение. Называется эта штука споттер. 

Ответить
1

Нейросеть вроде как не в самой колонке находится...

Следовательно, стартовую фразу распознаёт само устройство, а всё что после, идёт на сервер.

Если так, то всё, что мы тут обсуждаем - пустая болтовня без знания фактов.

Ответить
3

Нейросеть, которая распознает фразу "Слушай, Алиса" находится в самой колонке, конечно же.

Ответить
0

находится в самой колонке, конечно же

И это работает крайне плохо, тут уже были новости, что у Siri отправляются на анализ даже записи про покупку наркотиков, занятия сексом, итд

Ответить
0

Эмм, я боюсь спросить, а как она без микрофона узнает что эту фразу сказали? Ну и все голосовые помощники двигаются к очеловечиванию и им нужно уметь из контекста понимать что обращаются к ним. 

Ответить
0

Микрофон то будет, куда он денется. Но записывать и отправлять на сервер только после кодовой фразы. Ну это просто как мысль, что технически такое возможно думаю. Про очеловечивание да, соглашусь, круто было бы как с живым человеком общаться, а не начиная с кодовой фразы. Но вот есть обратная сторона медали.

Ответить
0

Оно ровно так и работает, инфа 100%. У меня был опыт реверс-инженеринга некоторых из устройств.

Ответить
0

А что мы тогда так переживаем, что нас записывают все время?)

Ответить
0

Речь не о том, что колонку не стоит покупать, а о самом факте того, что по принципу своей работы она по сути является дистанционным прослушивающим устройством.

Это просто информация к сведению и рассуждению.

Ответить
0

Так можно было бы сказать, если бы колонка посылала на сервер весь звук, а не только короткие отрывки после активационной фразы. А так это не в большей степени шпионское устройство, чем смартфон, ноут или телевизор со звуковым управлением.

Ответить

Комментарий удален

3

Какое-нибудь приложение действительно может в теории (но это не точно) куда-то передавать данные с камеры. Ну не ставьте всякие подозрительные приложения. Колонка 100% передает все что слышит, хранит записи только по закону яровой несколько месяцев, а скорее всего вечно, плюс к этому весь голос переводится в текст и тоже наверняка хранится вечно и проверяется как-минмум на ключевые слова кем надо. 

Ответить
0

Посчитайте сколько надо ресурсов гуглу и яндексу, чтобы ВСЮ речь 24\7 миллионов пользователей записывать, передавать себе, расшифровывать и хранить.

Ответить
1

Так она и так это делает, чтобы "алиса" как-то реагировала на вход она должна получить текст, этот текст она получает из голоса, который передает колонка на серверы яндекса. Из этого можно сделать вывод что все, что слышит колонка записывается и превращается в текст и, очевидно, никогда не удаляется.
На счет того, что все колонки генерят так много аудио и текста, что надо очень много дисков чтобы это хранить, то это ерунда. Во-первых не так и много, текст почти ничего не весит, а голос можно сильно сжать. Во-вторых ценность этой информации намного больше стоимости самих дисков. Представь что у тебя есть поток расшифровок разговоров на кухне в стране Россия. Даже боюсь начать фантазировать как это можно использовать. 

Ответить
0

Если данные никогда не удаляются, то где все эти эксабайты хранить? Сколько мощностей на это надо, сложно представить

Ответить
0

так выделяют из бюджета же

Ответить
0

у вас богатое воображение и нулевое представление о технической части умных колонок.

Ответить
0

Ни один сервер не сможет обрабатывать столько голосовой информации, чтобы передавать и анализировать все, что вы говорите в помещении (т.к. таких помещении сотни тысяч). Попробуйте для начала в математику и аналитику, а потом паранойте.

Если вами заинтересуется контролирующие структуры, то вас легко вычислят и без колонок и ноутбуков, не переживайте.

Ответить
0

*стандартный комментарий под подобными новостями

И ведь не надоедает...

Ответить
0

Кому ты нахрен нужен?)))

Ответить
6

Параноики негодуют

Ответить
8

“Если у вас нет паранойи, - это не значит, что за вами не следят” (с)

Ответить
0

Параноики, такую вещь в дом и близко не подпустят.

Ответить
3

Фольгированные шапочки, быстро, качественно, недорого.

Ответить
1

Если надеть это на колонку, думаю будет слышно в разы плохо.

Ответить
2

Это, как мне кажется, первейшая функция ассистентов - во всех рекламах у Яндекса колонкой пользуются несколько человек.

Ответить

Комментарий удален

1

Пока помощник может узнавать только одного человека.

И мы все его знаем.

Ответить
1

А Siri по-прежнему не может.

Ответить
1

Это офигенски круто...  

Ответить
1

Я уже подумал забросили колонку, ни одного существенного апдейта за полгода. Все разрабы ушли в сбер?

Ответить
0

По техзаданию товарища майора обновление прибыло. 

Ответить
0

Надо так:

Алиса, запомни мой голос: гаф гаф! 

Ответить
0

А то товарищ майор жаловался, что записи без фамилий.

Ответить
0

какая то сомнительная по пользе функция

Ответить
0

Попробовал, функция появилась. Запоминает имя и для обучения просит назвать несколько фраз.

Ответить
0

Так как колонка слушает всё, то "товарищ майор" был бы в шоке от разговоров из фильмов "Крепкий Орешек" и пр. Там постоянно борьба с террористами и охота за президентом. Так что паранойя не выдерживает никакой критики. А прослушка тех, кто смотрит "клубничку" вообще должна повергнуть чекиста в уныние... 

Ответить

Комментарии

null