«Яндекс» запустил тестовое распознавание отдельных голосов в колонках с «Алисой» Статьи редакции

Пока помощник может узнавать только одного человека.

В «умных» колонках с голосовым помощником «Алиса» появилось тестовая функция распознавания людей по голосу, рассказали vc.ru в «Яндексе» .

Чтобы записать свой голос, нужно сказать помощнику «Алиса, запомни мой голос» или «Давай познакомимся». На момент начала тестирования «Алиса» может записать только одного человека и отличать его от других.

К человеку, который записал свой голос, «Алиса» будет обращаться по имени, запоминать его музыкальные предпочтения и подбирать песни специально для него. В будущем «Яндекс» планирует добавить распознавание нескольких голосов по отдельности, дата запуска этой функции пока неизвестна.

0
43 комментария
Написать комментарий...
Андрей Андреев

Как по мне, то любая умная колонка с голосовым помощником - это добровольно установленное внутри помещения прослушивающее устройство.

Ответить
Развернуть ветку
Sam Beckett

А ноут с вебкамерой - добровольно установленное устройство видеозаписи. А телефон с GPS - устройство слежения

Ответить
Развернуть ветку
Андрей Андреев

Камера и микрофон на ноуте принудительно отключается.

Использование умной колонки подразумевает постоянное подключение к интернету для анализа голосовых запросов и работы голосового помощника.

Не надо включать заезженный троллинг про паранойю, это глупо.

Ответить
Развернуть ветку
Владислав Егоров
Камера и микрофон на ноуте принудительно отключается.  

На Станции есть кнопка, физически отключающая микрофоны. Такая есть на вашем ноуте?

Яндекс.Станция появилась уже год назад. И никто пока не взял какой-нибудь Wireshark и не доказал, что она посылает в сеть что-нибудь кроме голоса после активационного слова. Только однообразные шутки про товарища майора, которому почему-то очень интересно, какую музыку я предпочитаю.

Так что это именно свист и паранойя уровня шапочек из фольги. Причем паранойя негодная, так как параноики почему-то не спешат выбрасывать свои ноутбуки и смартфоны — постоянно подключенные к интернету устройства с GPS, микрофонами и видеокамерами, содержащие уйму информации об их владельцах — но очень боятся, что кто-то будет слушать их разговоры перед телевизором.

Ответить
Развернуть ветку
Дима Перегон

Ну на Яндекс.Станции можно выключить принудительно микрофон прям разомкнув цепь. Ну т вас никто же не заставляет себе колонку покупать и использовать.

Ответить
Развернуть ветку
Сергей Я

На самом деле можно было бы придумать техническое решение, что запись на микрофон будет осуществляться только после фразы "Слушай, Алиса". Но кому это нужно.

Ответить
Развернуть ветку
Дима Перегон

Ну а как без записи и постоянного прослушивания она должна понять, что к ней обратились?

Ответить
Развернуть ветку
Виталий Воробьев

Нейросеть обучена на фразу "Слушай, Алиса" и работает на стороне устройства, без обращение на внешний сервер.

Когда устройство опознает фразу-обращение, оно уже передает запрос в яндекс, где его обрабатывают и возращают колонке.

Ответить
Развернуть ветку
Гала Перидоловна

Оно именно так и работает. Все колонки имеют небольшой контроллер не подключённый к основной soc. Он распознаёт обращение. Называется эта штука споттер. 

Ответить
Развернуть ветку
Андрей Андреев

Нейросеть вроде как не в самой колонке находится...

Следовательно, стартовую фразу распознаёт само устройство, а всё что после, идёт на сервер.

Если так, то всё, что мы тут обсуждаем - пустая болтовня без знания фактов.

Ответить
Развернуть ветку
Виталий Воробьев

Нейросеть, которая распознает фразу "Слушай, Алиса" находится в самой колонке, конечно же.

Ответить
Развернуть ветку
Michael Smith
находится в самой колонке, конечно же

И это работает крайне плохо, тут уже были новости, что у Siri отправляются на анализ даже записи про покупку наркотиков, занятия сексом, итд

Ответить
Развернуть ветку
Гала Перидоловна

Эмм, я боюсь спросить, а как она без микрофона узнает что эту фразу сказали? Ну и все голосовые помощники двигаются к очеловечиванию и им нужно уметь из контекста понимать что обращаются к ним. 

Ответить
Развернуть ветку
Сергей Я

Микрофон то будет, куда он денется. Но записывать и отправлять на сервер только после кодовой фразы. Ну это просто как мысль, что технически такое возможно думаю. Про очеловечивание да, соглашусь, круто было бы как с живым человеком общаться, а не начиная с кодовой фразы. Но вот есть обратная сторона медали.

Ответить
Развернуть ветку
Гала Перидоловна

Оно ровно так и работает, инфа 100%. У меня был опыт реверс-инженеринга некоторых из устройств.

Ответить
Развернуть ветку
Сергей Я

А что мы тогда так переживаем, что нас записывают все время?)

Ответить
Развернуть ветку
Андрей Андреев

Речь не о том, что колонку не стоит покупать, а о самом факте того, что по принципу своей работы она по сути является дистанционным прослушивающим устройством.

Это просто информация к сведению и рассуждению.

Ответить
Развернуть ветку
Владислав Егоров

Так можно было бы сказать, если бы колонка посылала на сервер весь звук, а не только короткие отрывки после активационной фразы. А так это не в большей степени шпионское устройство, чем смартфон, ноут или телевизор со звуковым управлением.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
pwm73

Какое-нибудь приложение действительно может в теории (но это не точно) куда-то передавать данные с камеры. Ну не ставьте всякие подозрительные приложения. Колонка 100% передает все что слышит, хранит записи только по закону яровой несколько месяцев, а скорее всего вечно, плюс к этому весь голос переводится в текст и тоже наверняка хранится вечно и проверяется как-минмум на ключевые слова кем надо. 

Ответить
Развернуть ветку
//Silence is golden.

Посчитайте сколько надо ресурсов гуглу и яндексу, чтобы ВСЮ речь 24\7 миллионов пользователей записывать, передавать себе, расшифровывать и хранить.

Ответить
Развернуть ветку
pwm73

Так она и так это делает, чтобы "алиса" как-то реагировала на вход она должна получить текст, этот текст она получает из голоса, который передает колонка на серверы яндекса. Из этого можно сделать вывод что все, что слышит колонка записывается и превращается в текст и, очевидно, никогда не удаляется.
На счет того, что все колонки генерят так много аудио и текста, что надо очень много дисков чтобы это хранить, то это ерунда. Во-первых не так и много, текст почти ничего не весит, а голос можно сильно сжать. Во-вторых ценность этой информации намного больше стоимости самих дисков. Представь что у тебя есть поток расшифровок разговоров на кухне в стране Россия. Даже боюсь начать фантазировать как это можно использовать. 

Ответить
Развернуть ветку
Vadim Zhdanov

Если данные никогда не удаляются, то где все эти эксабайты хранить? Сколько мощностей на это надо, сложно представить

Ответить
Развернуть ветку
Aleks B

так выделяют из бюджета же

Ответить
Развернуть ветку
//Silence is golden.

у вас богатое воображение и нулевое представление о технической части умных колонок.

Ответить
Развернуть ветку
//Silence is golden.

Ни один сервер не сможет обрабатывать столько голосовой информации, чтобы передавать и анализировать все, что вы говорите в помещении (т.к. таких помещении сотни тысяч). Попробуйте для начала в математику и аналитику, а потом паранойте.

Если вами заинтересуется контролирующие структуры, то вас легко вычислят и без колонок и ноутбуков, не переживайте.

Ответить
Развернуть ветку
Eugene Podosenov

*стандартный комментарий под подобными новостями

И ведь не надоедает...

Ответить
Развернуть ветку
Елена Краско

Кому ты нахрен нужен?)))

Ответить
Развернуть ветку
Вы в федеральном розыске

Параноики негодуют

Ответить
Развернуть ветку
pwm73

“Если у вас нет паранойи, - это не значит, что за вами не следят” (с)

Ответить
Развернуть ветку
Николай Петров

Параноики, такую вещь в дом и близко не подпустят.

Ответить
Развернуть ветку
Vlad Limbo

Фольгированные шапочки, быстро, качественно, недорого.

Ответить
Развернуть ветку
Bilguun Billy

Если надеть это на колонку, думаю будет слышно в разы плохо.

Ответить
Развернуть ветку
Pavel Kogan

Это, как мне кажется, первейшая функция ассистентов - во всех рекламах у Яндекса колонкой пользуются несколько человек.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Alexey Kott
Пока помощник может узнавать только одного человека.

И мы все его знаем.

Ответить
Развернуть ветку
Mike Kosulin

А Siri по-прежнему не может.

Ответить
Развернуть ветку
Цой жив

Это офигенски круто...  

Ответить
Развернуть ветку
Andrey Bronin

Я уже подумал забросили колонку, ни одного существенного апдейта за полгода. Все разрабы ушли в сбер?

Ответить
Развернуть ветку
Anatoly Ivanov

По техзаданию товарища майора обновление прибыло. 

Ответить
Развернуть ветку
Saucedo Puetz

Надо так:

Алиса, запомни мой голос: гаф гаф! 

Ответить
Развернуть ветку
Michael Smith

А то товарищ майор жаловался, что записи без фамилий.

Ответить
Развернуть ветку
Azaz Azazov

какая то сомнительная по пользе функция

Ответить
Развернуть ветку
Sasha Belousov

Попробовал, функция появилась. Запоминает имя и для обучения просит назвать несколько фраз.

Ответить
Развернуть ветку
Viacheslav B

Так как колонка слушает всё, то "товарищ майор" был бы в шоке от разговоров из фильмов "Крепкий Орешек" и пр. Там постоянно борьба с террористами и охота за президентом. Так что паранойя не выдерживает никакой критики. А прослушка тех, кто смотрит "клубничку" вообще должна повергнуть чекиста в уныние... 

Ответить
Развернуть ветку
40 комментариев
Раскрывать всегда