Как научить нейросеть правильно ставить ударения.
Для презентационного ролика про новую экосистему коммуникаций IVA мы решили передать мяч на сторону ИИ, пусть нейросеть сама показывает и рассказывает за 45 секунд про все продукты бренда.
Найти подходящий голос было не так просто, но, применив технологию синтеза речи, мы научили нейросеть воспроизводить голос зарубежной актрисы дубляжа. А вот над характером пришлось поработать подольше.
Никак не хотела она говОрить правильно, по-человечески. Добавляли глаааасные, растягивали акцент, выделЯли буквы и многие других “хитрости”.
В совокупность получили очень симпатичный персонаж с логичными акцентами и мягким тембром, сами послушайте https://fabulaprod.ru/keysy/iva.
Передача автомобиля в залог — распространённая и надёжная практика получения средств, особенно когда речь идёт о займах под ПТС. Однако, как и в любой сфере, здесь могут возникать попытки мошенничества. Один из распространённых сценариев — попытка заемщика после получения денег продать автомобиль, переданный в залог, или разобрать его на запчасти.…
В 2024 году с её помощью Уилл Смит «заговорил» на португальском в рекламе Nomad.
Конгрессмен Дженнифер Векстон стала первым человеком, выступившим с речью в Палате представителей США, используя клонированный с помощью нейросетей голос.
Голос в рекламе — это эмоция, доверие и характер бренда. Правильный диктор может сделать ваш ролик убедительным, вызвать интерес и создать нужную атмосферу. А неправильный — похоронить даже самый дорогой и красивый продакшн.
Все сейчас говорят, что нужно внедрять AI в отдел продаж и в целом в бизнес. Я же написал 5 причин, почему не стоит внедрять их и работать спокойно
Модель пока не поддерживает русский язык, в соцсетях её используют для практики разговорного английского.
Давно сам изучаю сервисы и модельки по синтезированию голоса - прекрасное дополнение к автоматизированным системам маркетинга, продаж и поддержки клиента.
Сейчас же для меня было важно найти ИИ партнера по созданию эмоциональных голосовых синтезов.
Искусственный интеллект продолжает ломать барьеры, и свежий релиз от разработчиков Sesame — это, без преувеличения, революция в области синтеза речи. Их новая открытая и бесплатная модель позволяет превратить текст в живую, реалистичную речь, сохраняя интонации и темп живого голоса.
ИИ-реклама больше не эксперимент — она уже заменяет классический продакшен