Как озвучивать ботов, книги и видео для соцсетей голосами Кроша из мультсериала «Смешарики», Ленина и ребенка

В декабре мы в Just AI представили маркетплейс голосов Aimyvoice, который позволяет синтезировать живую речь. Теперь рассказываем, кому подойдет продукт, как им пользоваться и сколько это стоит.

Как озвучивать ботов, книги и видео для соцсетей голосами Кроша из мультсериала «Смешарики», Ленина и ребенка

Ленин, Крош из мультсериала «Смешарики» и другие голоса

На текущий момент в каталоге Aimyvoice доступно 19 голосов, в том числе Кроша из мультсериала «Смешарики», актрисы дубляжа Татьяны Литвиновой, в портфолио которой мультфильм «Сад изящных слов», сериал «Судьба: Сага клуба Винкс» и другие работы, а также стереотипных персонажей — Ленина, Деда Мороза и др.

Голоса в Aimyvoice делятся на публичные, лицензионные и закрытые. Первые можно использовать для синтеза любых текстов. Перед работой с лицензионным голосом, например, Кроша из мультсериала «Смешарики», нужно купить лицензию у правообладателя. Закрытые голоса может использовать только их создатель, такой путь выбрали в стартапе «Умный Мишка», детской интеллектуальной игрушки.

Мы очень ждали появления полноценного инструмента Aimyvoice. Благодаря ему мы сможем выпустить большое количество фич, на которые есть запрос у наших пользователей, и ранее мы не могли их реализовать, так как актер озвучивания всегда ограничен в возможностях записи. Первое направление, которое мы запустим с использованием платформы — это генерация имени, чтобы Мишка обращался к ребенку по имени. Естественно, записать все имена, во всех вариациях с помощью актера просто невозможно. Второе — это подключение объемных текстов из энциклопедий, чтобы Мишка рассказывал о динозаврах, ледниках, различных природных явлениях. Третье направление — образовательное. Сгенерированный на платформе Aimyvoice голос позволит нам сделать различные варианты одних задач и выдавать их в зависимости от возраста и конкретных навыков ребенка.

Андрей Тесленко,

Операционный директор MISHKA AI, Inc.

Кому подойдет

Креаторы смогут использовать синтезированные в Aimyvoice записи для озвучивания подкастов и видео в соцсетях, для создания открыток, поздравлений и мемов. ТВ, медиа, контент-студиям и геймдев-компаниям Aimyvoice позволит озвучивать диалоги и нарративы в видеоиграх, быстро создавать аудиокниги, зачитывать объявления и новости.

Бизнес сможет использовать платформу для проектов умного IVR, исходящих звонков, поддержки пользователей, голосовых ассистентов и разговорного UX в приложениях, а также для объявлений и анонсов в офисах и магазинах. Отдельная услуга, специально разработанная для крупных компаний — создание уникального брендированного голоса, который сможет стать элементом фирменной айдентики, наряду с логотипом и слоганом.

Сложно сказать, где синтезированная речь окажется наиболее востребованной, так как это пока новая, неизведанная сфера. Предполагаю, что синтез окажется полезен для создания голосовых помощников и начитки аудиокниг, особенно детских. Ребенок обычно не улавливает недоработки в части интонирования и произношения звуков, в то время как я, например, очень притязательный слушатель.

Татьяна Литвинова,

Актриса дубляжа

Созданный голос и вправду очень похож на голос нашего актёра озвучивания Антона Виноградова. Его можно задействовать, например, в компьютерных играх, промоакциях, выставках, каких-то коллаборациях, где привлекать артистов нет необходимости. Но данный сервис не станет заменой настоящего актера, потому что помимо голоса, человек, работающий с персонажем, вкладывает в него душу, частичку себя, что-то очень личное, что не считать никаким алгоритмом.

Майя Москвичева, Генеральный директор лицензионного агентства «Мармелад Медиа» (входит в ГК «Рики»)

Как пользоваться

Есть два варианта использования Aimyvoice: Telegram @Aimyvoice_bot и сайт проекта. Синтезировать можно короткие фразы объемом до 250 знаков с пробелами. В боте доступны восемь публичных голосов из каталога, на сайте — как публичные голоса, так и закрытые, к которым у пользователя есть доступ. Также на сайте можно создать свой голос и затем использовать его для синтеза.

Синтез в боте происходит так: пользователь выбирает голос из каталога (примеры всех голосов можно предварительно прослушать), вводит текст и через несколько секунд получает готовую запись. С помощью специальных символов можно управлять процессом синтеза: если Aimyvoice ошибется в ударении, достаточно поставить + после ударной гласной, чтобы получить корректный вариант. Если отдельное слово в предложении хочется выделить интонацией, стоит просто поставить перед ним #. Также можно добавлять паузы и задать громкость и темп синтезированной речи, это делается с помощью SSML-тегов. Синтезированные в Telegram-боте записи можно сохранить в формате MP3.

На сайте Aimyvoice записи синтезируют через API. Пользователи визуального конструктора для создания ботов Aimylogic или платформы корпоративного уровня JAICP от Just AI могут использовать синтез непосредственно в этих продуктах.

Сколько стоит синтез

На старте каждому пользователю Telegram-бота предоставляется минута синтеза, 20 дополнительных минут на данный момент стоят 99 руб. Пакет минут можно купить прямо в боте.

Минута синтеза с помощью публичных голосов на сайте Aimyvoice обойдется в 1-5 руб. Цена на лицензионные голоса отправляется по запросу. Оплата взимается только за использование голосов через POST-запросы.

99
4 комментария

А «свой» голос можно туда добавить?

Пока нет. Но мы работаем над этим функционалом.

1