«Яндекс» запустил тестовое распознавание отдельных голосов в колонках с «Алисой» Статьи редакции

Пока помощник может узнавать только одного человека.

В «умных» колонках с голосовым помощником «Алиса» появилось тестовая функция распознавания людей по голосу, рассказали vc.ru в «Яндексе» .

Чтобы записать свой голос, нужно сказать помощнику «Алиса, запомни мой голос» или «Давай познакомимся». На момент начала тестирования «Алиса» может записать только одного человека и отличать его от других.

К человеку, который записал свой голос, «Алиса» будет обращаться по имени, запоминать его музыкальные предпочтения и подбирать песни специально для него. В будущем «Яндекс» планирует добавить распознавание нескольких голосов по отдельности, дата запуска этой функции пока неизвестна.

0
43 комментария
Популярные
По порядку
Написать комментарий...

Как по мне, то любая умная колонка с голосовым помощником - это добровольно установленное внутри помещения прослушивающее устройство.

4

А ноут с вебкамерой - добровольно установленное устройство видеозаписи. А телефон с GPS - устройство слежения

13

Камера и микрофон на ноуте принудительно отключается.

Использование умной колонки подразумевает постоянное подключение к интернету для анализа голосовых запросов и работы голосового помощника.

Не надо включать заезженный троллинг про паранойю, это глупо.

7

Камера и микрофон на ноуте принудительно отключается.  

На Станции есть кнопка, физически отключающая микрофоны. Такая есть на вашем ноуте?

Яндекс.Станция появилась уже год назад. И никто пока не взял какой-нибудь Wireshark и не доказал, что она посылает в сеть что-нибудь кроме голоса после активационного слова. Только однообразные шутки про товарища майора, которому почему-то очень интересно, какую музыку я предпочитаю.

Так что это именно свист и паранойя уровня шапочек из фольги. Причем паранойя негодная, так как параноики почему-то не спешат выбрасывать свои ноутбуки и смартфоны — постоянно подключенные к интернету устройства с GPS, микрофонами и видеокамерами, содержащие уйму информации об их владельцах — но очень боятся, что кто-то будет слушать их разговоры перед телевизором.

5

Ну на Яндекс.Станции можно выключить принудительно микрофон прям разомкнув цепь. Ну т вас никто же не заставляет себе колонку покупать и использовать.

2

На самом деле можно было бы придумать техническое решение, что запись на микрофон будет осуществляться только после фразы "Слушай, Алиса". Но кому это нужно.

0

Ну а как без записи и постоянного прослушивания она должна понять, что к ней обратились?

5

Нейросеть обучена на фразу "Слушай, Алиса" и работает на стороне устройства, без обращение на внешний сервер.

Когда устройство опознает фразу-обращение, оно уже передает запрос в яндекс, где его обрабатывают и возращают колонке.

–1

Оно именно так и работает. Все колонки имеют небольшой контроллер не подключённый к основной soc. Он распознаёт обращение. Называется эта штука споттер. 

3

Нейросеть вроде как не в самой колонке находится...

Следовательно, стартовую фразу распознаёт само устройство, а всё что после, идёт на сервер.

Если так, то всё, что мы тут обсуждаем - пустая болтовня без знания фактов.

1

Нейросеть, которая распознает фразу "Слушай, Алиса" находится в самой колонке, конечно же.

3

находится в самой колонке, конечно же

И это работает крайне плохо, тут уже были новости, что у Siri отправляются на анализ даже записи про покупку наркотиков, занятия сексом, итд

0

Эмм, я боюсь спросить, а как она без микрофона узнает что эту фразу сказали? Ну и все голосовые помощники двигаются к очеловечиванию и им нужно уметь из контекста понимать что обращаются к ним. 

0

Микрофон то будет, куда он денется. Но записывать и отправлять на сервер только после кодовой фразы. Ну это просто как мысль, что технически такое возможно думаю. Про очеловечивание да, соглашусь, круто было бы как с живым человеком общаться, а не начиная с кодовой фразы. Но вот есть обратная сторона медали.

0

Оно ровно так и работает, инфа 100%. У меня был опыт реверс-инженеринга некоторых из устройств.

0

А что мы тогда так переживаем, что нас записывают все время?)

0

Речь не о том, что колонку не стоит покупать, а о самом факте того, что по принципу своей работы она по сути является дистанционным прослушивающим устройством.

Это просто информация к сведению и рассуждению.

0

Так можно было бы сказать, если бы колонка посылала на сервер весь звук, а не только короткие отрывки после активационной фразы. А так это не в большей степени шпионское устройство, чем смартфон, ноут или телевизор со звуковым управлением.

0

Комментарий удален

Какое-нибудь приложение действительно может в теории (но это не точно) куда-то передавать данные с камеры. Ну не ставьте всякие подозрительные приложения. Колонка 100% передает все что слышит, хранит записи только по закону яровой несколько месяцев, а скорее всего вечно, плюс к этому весь голос переводится в текст и тоже наверняка хранится вечно и проверяется как-минмум на ключевые слова кем надо. 

3

Посчитайте сколько надо ресурсов гуглу и яндексу, чтобы ВСЮ речь 24\7 миллионов пользователей записывать, передавать себе, расшифровывать и хранить.

0

Так она и так это делает, чтобы "алиса" как-то реагировала на вход она должна получить текст, этот текст она получает из голоса, который передает колонка на серверы яндекса. Из этого можно сделать вывод что все, что слышит колонка записывается и превращается в текст и, очевидно, никогда не удаляется.
На счет того, что все колонки генерят так много аудио и текста, что надо очень много дисков чтобы это хранить, то это ерунда. Во-первых не так и много, текст почти ничего не весит, а голос можно сильно сжать. Во-вторых ценность этой информации намного больше стоимости самих дисков. Представь что у тебя есть поток расшифровок разговоров на кухне в стране Россия. Даже боюсь начать фантазировать как это можно использовать. 

1

Если данные никогда не удаляются, то где все эти эксабайты хранить? Сколько мощностей на это надо, сложно представить

0

так выделяют из бюджета же

0

у вас богатое воображение и нулевое представление о технической части умных колонок.

0

Ни один сервер не сможет обрабатывать столько голосовой информации, чтобы передавать и анализировать все, что вы говорите в помещении (т.к. таких помещении сотни тысяч). Попробуйте для начала в математику и аналитику, а потом паранойте.

Если вами заинтересуется контролирующие структуры, то вас легко вычислят и без колонок и ноутбуков, не переживайте. ред.

0

*стандартный комментарий под подобными новостями

И ведь не надоедает...

0

Кому ты нахрен нужен?)))

0

Параноики негодуют

6

“Если у вас нет паранойи, - это не значит, что за вами не следят” (с)

8

Параноики, такую вещь в дом и близко не подпустят.

0

Фольгированные шапочки, быстро, качественно, недорого.

3

Если надеть это на колонку, думаю будет слышно в разы плохо.

1

Это, как мне кажется, первейшая функция ассистентов - во всех рекламах у Яндекса колонкой пользуются несколько человек.

2

Комментарий удален

Пока помощник может узнавать только одного человека.

И мы все его знаем.

1

А Siri по-прежнему не может.

1

Это офигенски круто...  

1

Я уже подумал забросили колонку, ни одного существенного апдейта за полгода. Все разрабы ушли в сбер?

1

По техзаданию товарища майора обновление прибыло. 

0

Надо так:

Алиса, запомни мой голос: гаф гаф! 

0

А то товарищ майор жаловался, что записи без фамилий.

0

какая то сомнительная по пользе функция

0

Попробовал, функция появилась. Запоминает имя и для обучения просит назвать несколько фраз.

0

Так как колонка слушает всё, то "товарищ майор" был бы в шоке от разговоров из фильмов "Крепкий Орешек" и пр. Там постоянно борьба с террористами и охота за президентом. Так что паранойя не выдерживает никакой критики. А прослушка тех, кто смотрит "клубничку" вообще должна повергнуть чекиста в уныние... 

0
Читать все 43 комментария
Созданная «Яндексом» компания ClickHouse привлекла $250 млн при оценке в $2 млрд Статьи редакции

Инвестиции направят на расширение штата и развитие международного бизнеса.

Пользователь купил «мемную» криптовалюту Shiba Inu на $8 тысяч в августе 2020 года и стал миллиардером Статьи редакции

За месяц криптовалюта выросла на 1000%.

Оплата уставного капитала и оплата долей – почему это важно?

В ходе проведения юридических проверок (due diligence) мы всё чаще сталкиваемся с ситуациями, когда клиенты не хранят документы об оплате уставного капитала/доли (акции) и не считают отсутствие подтверждения критичным фактом — «Налоговая всё зарегистрировала, зачем хранить ненужные бумажки?!».

Ozon скинул ответственность за свои ошибки в сборке и доставке на продавца FBO. Кто прав?
«Альфа-банк» отключил части клиентов бесплатные push-уведомления о покупках Статьи редакции

Бесплатные push-уведомления останутся только для подтверждения операций.

Что на самом деле приводит мир в движение: история инструментов бухгалтерского учёта

От засечек на палках до специальных программ

UNIVAC I.
Как сотрудники Tele2 стали лицами бренда

Кто сказал, что сниматься для рекламы могут только профессиональные модели? В компании Tele2 лицами для внутренних и внешних рекламных кампаний становятся даже собственные сотрудники! Мы собрали истории коллег, которые подали заявки на конкурс и приняли участие в профессиональной фотосессии, а теперь их портреты украшают фотобанк Tele2.

Топ-5 EdTech стартапов, которые сделают ваше обучение проще и интереснее

Осенью в нашей стране традиционно начинается учебный год. Тысячи школьников и студентов отныне делятся на два лагеря: одни ищут пути быстрее и с наименьшими потерями покончить с учёбой, другие — с радостью спешат на лекции и уроки. Есть ещё и родители, и преподаватели с собственными проблемами и потребностями. Мы отобрали 5 образовательных…

«Там считают, если взял выходной — не любишь свою работу»: музыканты из Кирова зарабатывают в Китае $1500 в месяц Статьи редакции

Дорогу, миграционные документы и проживание оплачивали работодатели, а кавер-группа выступала каждый день.

Как мы организовали коллективное обучение в айти и почему оно лучше обычных курсов

Мы уже обучили и трудоустроили 47 отличных frontend-специалистов и не собираемся на этом останавливаться.

null