Новая технология наушников с ИИ и шумоподавлением позволяет владельцам выбирать, какие звуки они слышат

Большинство тех, кто пользовался наушниками с шумоподавлением, знают, что слышать правильный шум в нужное время может быть жизненно важно. Кому-то, возможно, захочется стереть автомобильные гудки при работе в помещении, но не при прогулке по оживленным улицам. Однако люди не могут выбирать, какие звуки глушат их наушники.

Новая технология наушников с ИИ и шумоподавлением позволяет владельцам выбирать, какие звуки они слышат

Теперь команда под руководством исследователей из Вашингтонского университета разработала алгоритмы глубокого обучения, которые позволяют пользователям выбирать, какие звуки фильтруются через их наушники в режиме реального времени. Команда называет систему «семантическим слухом». Наушники передают записанный звук на подключенный смартфон, который подавляет все звуки окружающей среды.

С помощью голосовых команд или приложения для смартфона владельцы наушников могут выбрать, какие звуки они хотят включить из 20 классов, таких как сирены, детский плач, речь, пылесосы и щебетание птиц. Через наушники будут воспроизводиться только выбранные звуки.

«Понимание того, как звучит птица, и выделение его из всех других звуков в окружающей среде требует интеллекта в реальном времени, чего не могут достичь современные наушники с шумоподавлением», — сказал старший автор Шьям Голлакота.

Новая технология наушников с ИИ и шумоподавлением позволяет владельцам выбирать, какие звуки они слышат

«Проблема в том, что звуки, которые слышат пользователи наушников, должны синхронизироваться с их зрительными ощущениями. Вы не можете услышать чей-то голос через две секунды после того, как они с вами разговаривают. Это означает, что нейронные алгоритмы должны обрабатывать звуки менее чем за сотую долю секунды». "

Протестированная в таких условиях, как офисы, улицы и парки, система смогла извлечь сирены, щебетание птиц, сигналы тревоги и другие звуки, удаляя при этом все остальные реальные шумы. Когда 22 участника оценили аудиовыход системы по целевому звуку, они сказали, что в среднем качество улучшилось по сравнению с исходной записью.

В некоторых случаях система с трудом различала звуки, имеющие много общих свойств, например вокальную музыку и человеческую речь. Исследователи отмечают, что обучение моделей на большем количестве реальных данных может улучшить эти результаты.

Надеюсь вам понравилась статья.

Так же, у меня есть свой канал, в котором я размещаю интересные новости, обзоры и сервисы по нейросетям и искусственному интеллекту, которые помогают в работе и жизни. Если вам интересна эта тема, буду рад вас там видеть -

66
1 комментарий

Идея интересная и кажется, что не такая уж и сложная, думаю вполне в ближайшие пару лет такие наушники появятся.

1
Ответить