27 авг 2019 27.08.2019

Специалисты создали нейросеть для создания поддельных голосов Статьи редакции

Алгоритм умеет имитировать голос говорящего по фрагменту стороннего аудиофайла.

Группа разработчиков создала алгоритм для синтеза текста в речь (text-to-speech; TTS) на основе нейросетевых моделей Tacotron 2 и WaveNet, который умеет создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла, делая его похожим на голос говорящего из первого файла.

Пример работы алгоритма

#нейросети

0 показов

47K открытий

53 комментария

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Владлен Субботин

28.08.2019

Следующий шаг - создание виртуальной маски лица.
Смотришь в камеру, а специальный софт преобразовывает твое лицо в необходимое для прохождения биометрии.
А слепки отпечатков пальцев появились с выходов iPhone 5 для его разблокировки.

Ответить

Развернуть ветку

Артем Королёв

28.08.2019

уже же есть подделка лица

Ответить

Развернуть ветку

Владлен Субботин

28.08.2019

Именно таким способом?
Я знаю, что маски реальные 3D делали. И их сеть распознавала, как оригинал.

Ответить

Развернуть ветку

Артем Королёв

28.08.2019

ну на запись легко накладывают в онлайне не в курсе

Ответить

Развернуть ветку

Показать 53 комментария . Вы видите только часть дискуссии

Написать комментарий...

50 комментариев

Раскрывать всегда