Когда-то давно в школе объясняли, что телефон режет полосу голоса (то есть полоса пропускания телефонной линии меньше полосы частот голоса человека). Судя по работе некоторых сотовых операторов - с тех пор мало что улучшилось. Поэтому не очень ясно как можно идентифицировать человека по голосу записав его живьём (заметьте не в студии звукозаписи в тишине, а в отделении где гвалт и разговоры на заднем плане), а потом сравнить это с тем, что клиент произнесёт по телефону?
Шумы можно фильтровать прямо при записи даже в шумном помещении. Например, ставится два микрофона, один записывает шум, второй голос+шум. Далее из той дорожки где голос+шум вычитается та где только шум, и полчается намного менее зашумленный голос. К слову, в любом нормальном смартфоне тоже несколько микрофонов именно для этого.
Что касается полосы пропускания при передаче голоса сотовыми операторами, там не просто режутся частоты, а используется вокодер- кодировщик голоса, который оцифровывает голос при помощи психоакустической модели(то есть нахрен может изменить частотный состав голоса в угоду снижению трафика, но субъективно будет казаться похоже). И все равно для системы распознавания останется дофига уникальных данных чтобы найти отличие.
Когда-то давно в школе объясняли, что телефон режет полосу голоса (то есть полоса пропускания телефонной линии меньше полосы частот голоса человека). Судя по работе некоторых сотовых операторов - с тех пор мало что улучшилось. Поэтому не очень ясно как можно идентифицировать человека по голосу записав его живьём (заметьте не в студии звукозаписи в тишине, а в отделении где гвалт и разговоры на заднем плане), а потом сравнить это с тем, что клиент произнесёт по телефону?
Шумы можно фильтровать прямо при записи даже в шумном помещении. Например, ставится два микрофона, один записывает шум, второй голос+шум. Далее из той дорожки где голос+шум вычитается та где только шум, и полчается намного менее зашумленный голос. К слову, в любом нормальном смартфоне тоже несколько микрофонов именно для этого.
Что касается полосы пропускания при передаче голоса сотовыми операторами, там не просто режутся частоты, а используется вокодер- кодировщик голоса, который оцифровывает голос при помощи психоакустической модели(то есть нахрен может изменить частотный состав голоса в угоду снижению трафика, но субъективно будет казаться похоже). И все равно для системы распознавания останется дофига уникальных данных чтобы найти отличие.
Плохая у вас школа была.