попробовал создать видео - написал короткий текст. Оно генерировалось под 40 минут, в итоге - девушка на видео (она снята на видео, не 3д модель) читает какой-то рандомный текст, который совсем не совпадает со звуком. Сам же текст, произносится примерно как гугл-переводчиком. Короче, это стоковое видео с девушкой, которая что-то говорит, шевелит губами, но разобрать невозможно, при этом с текстом движения не совпадают, и на это видео наложен звук машинного голоса, читающего ваш текст.
попробовал создать видео - написал короткий текст. Оно генерировалось под 40 минут, в итоге - девушка на видео (она снята на видео, не 3д модель) читает какой-то рандомный текст, который совсем не совпадает со звуком. Сам же текст, произносится примерно как гугл-переводчиком.
Короче, это стоковое видео с девушкой, которая что-то говорит, шевелит губами, но разобрать невозможно, при этом с текстом движения не совпадают, и на это видео наложен звук машинного голоса, читающего ваш текст.
Ну хз.
Все так, выглядит паршиво и неестественно.
В качестве прототипов ведущих были взяты реальные люди, а вот их речь и мимика генерируются с помощью нейронных сетей.