Google добавила в мессенджер Google Duo функцию восполнения обрывков слов во время разговоров Статьи редакции
Во время беседы звук может искажаться и прерываться — технология восстанавливает отсутствующие фрагменты.
Google улучшила качество аудиозвонков в Google Duo, используя систему WaveNetEQ с поддержкой технологий искусственного интеллекта. Об этом компания рассказала в своём блоге.
99% разговоров в Google Duo совершаются с потерей пакетов данных, задержкой и избыточным искажением сигнала, подсчитали в компании. Чтобы решить эту проблему, разработчики применили технологию PLC (packet loss concealment).
WaveNetEQ — система PLC, которая реалистично синтезирует недостающие фрагменты живой речи. Работа WaveNetEQ основана на большом массиве речевых данных — записанных голосах 100 людей, говорящих на 48 языках.
Технология анализирует речь, чтобы синтезировать продолжение звучания, если голос говорящего временно пропадёт. Когда передача речи восстанавливается, технология «соединяет» искусственный звук с настоящим.
Система «обучена» распознавать речь в разной обстановке, с разным уровнем фонового шума. Пока что WaveNetEQ может «угадывать» только последующие слоги, но не слова, отмечают разработчики.
ждем волну анекдотов на подобие T9))
Чувствую, скоро запилят приложение, которое будет при разговоре с женой автоматически вести разговор со стороны мужа, периодически вставляя: "Да", "Нет", "Да ладно?" и прочие короткие фразы. Это ж какая разгрузка мужского мозга во всемирном масштабе! Сразу и семейное насилие на спад пойдет.
Комментарий недоступен