Специалисты создали нейросеть для создания поддельных голосов Статьи редакции

Алгоритм умеет имитировать голос говорящего по фрагменту стороннего аудиофайла.

Группа разработчиков создала алгоритм для синтеза текста в речь (text-to-speech; TTS) на основе нейросетевых моделей Tacotron 2 и WaveNet, который умеет создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла, делая его похожим на голос говорящего из первого файла.

Пример работы алгоритма
0
53 комментария
Написать комментарий...
Макс Мухарёв

Ситуация ни капельки не страшная, а вполне прогнозируемая. И вместо того, чтобы закрывать глаза на это, и делать тупые мувы из разряда "мы примем закон, который запретит это и все будет хорошо", нужно искать решения.

На мой взгляд пора усиленно работать в области электронной подписи, где каждый материал может быть подписан личной подписью. Других способов увеличить доверие к источнику я пока не вижу. Таким образом появится и личная ответственность за публикацию. А кроме ответственности появится и защита информации. Можно будет легко отличить фейк от реальной информации. При этом анонимные источники тоже должны существовать, но к ним будет доверие гораздо ниже.

С голосом тоже самое - должна произойти ситуация, вроде "голос поступил из неизвестного источника и не принадлежит вашему сыну. Пометить как спам?"

И это хорошо бы уже сейчас начинать внедрять в браузеры и операционные системы.

Ответить
Развернуть ветку
Кроко

Так нет же проблемы то никакой. Поступает информация, а не голос. Доверять ей или нет - давно уже есть решения.

Ответить
Развернуть ветку
Макс Мухарёв

Какие?)

Ответить
Развернуть ветку
Кроко

Электронная подпись.

Ответить
Развернуть ветку
Макс Мухарёв

А я о чем?

Ответить
Развернуть ветку
Кроко

Я не очень понял, значит. В контексте темы с подменой голоса. Понятно, что обычный телефонный разговор не подпишешь (сейчас говорим о том, что есть) и подмена голоса воспринимается как "подпись", что сообщаемой информации "мам/пап занеси тому дяде денег" можно верить.

Ответить
Развернуть ветку
Nikita Rogatov

не доверяй Ж) вот и все решение

Ответить
Развернуть ветку
Макс Мухарёв

Если бы все так было просто. Помните историю с торговым центром в Кемерово и пранком? Отлично зашло.
А теперь представьте, что вы сидите в стеклянном куполе и все источники информации говорят вас о том, что началась война, например, и человечество было уничтожено. Какие у вас есть способы понять, что это лишь эксперимент лично над вами?

Ответить
Развернуть ветку
Кроко

Звонок другу?

Ответить
Развернуть ветку
Макс Мухарёв

А если друг в таком же пузыре?

Ответить
Развернуть ветку
Кроко

Нет, над ним же не проводится эксперимент. Значит он не в пузыре а с пузырем в соседнем баре.

Ответить
Развернуть ветку
Макс Мухарёв

Так мы уже все давно в пузыре, если уж на то пошло. А наши родители в своем собственном. Фиг убедишь, что мир изменился, а звонить могут могут не только важные люди, но и мошенники, роботы, инопланетяне, Олег Тиньков... )))

Ответить
Развернуть ветку
50 комментариев
Раскрывать всегда