Нейросети для озвучки текстов, которые работают в России

Чтобы профессионально озвучить контент или просто поиграться.

Нейросети для озвучки текстов, которые работают в России

В этой статье — девять нейросетей для озвучки текста. С их помощью прослушивают веб-страницы и аудиокниги, озвучивают видео, игры, презентации, сторисы, субтитры, тиктоки, рилсы и другой контент. Можно выбирать голоса, в том числе персонажей и знаменитостей: пара кликов — и вот уже Дарт Вейдер читает вам книгу.

О всех возможностях — ниже.

Содержание

Как это работает

Пользователь печатает или вставляет текст, который нужно озвучить, — и нейросеть синтезирует результат. Некоторые сервисы могут озвучивать тексты из загруженных файлов.

  • Периодически ИИ неправильно делает ударения, но это поправимо: в сервисах можно отметить, на каком слоге его поставить. Также есть возможность менять интонацию, например, на вопросительную. И указывать, где нужны паузы.
  • У многих сервисов есть бесплатные и платные голоса. Последние звучат реалистичнее.
  • Как правило, созданный контент разрешают использовать в коммерческих целях. Обычно такая опция доступна по платной подписке.

NaturalReader

Веб-версия, мобильная версия, веб-приложение для Mac, расширения браузера

Источник: NaturalReader 
Источник: NaturalReader 
  • NaturalReader поддерживает несколько языков, в том числе русский. Но сам интерфейс — на английском.

  • Предусмотрены два ИИ: NaturalReader AI Text to Speech — для персонального использования и NaturalReader AI Voice Generator — для коммерческого. Последний — для озвучки контента, который станет доступен всем, например появится в рилсе или видео на YouTube.

  • Есть возможность загружать файлы с текстами. Нейросеть поддерживает больше 20 форматов: от PDF, DOC(X) и XLS(X) до HTML, TIFF и SVG. Полный список здесь. Максимальный размер файла — 200 Мб для PDF и 50 Мб — для всех остальных форматов.

  • Есть мобильная версия. Из плюшек — если отсканировать камерой смартфона книгу или любой другой текст, нейросеть её озвучит.

  • Если добавить расширение Chrome от NaturalReader, появится возможность прослушивать веб-страницы, файлы Google Docs, электронные книги Kindle и имейл-письма из браузера.

Бесплатные опции

  • Ограничений на использование бесплатных голосов нет.
  • Лимит на бесплатное использование голосов из списка Premium — 20 минут в день, а на Plus — 5 минут в день.
  • Расширение для браузера — бесплатное.

Сколько стоит

  • От $9,99 на тарифах для персонального использования. Plus дороже, потому что голоса в нём звучат реалистичнее других.
  • Оплата за месяц или год вперёд.
Тарифы для персонального использования
Тарифы для персонального использования

Тарифы для коммерческого использования в месяц / в год

«Звукограм»

Веб-версия, телеграм-бот

Источник: «Звукограм» 
Источник: «Звукограм» 
  • Более 1000 голосов.

  • До 2 000 000 символов за одну конвертацию. На заметку: текст на листе А4 12 шрифтом равен приблизительно 4000 символов.

  • Можно озвучивать субтитры. Для это нужно загрузить файл в форматах SRT, VTT или SUB.

  • Есть возможность извлекать mp3 из ютуб-роликов — понадобится, если нужно «достать» звук из видео.

  • За каждую озвучку в сервисе списываются токены — это внутренняя валюта «Звукограма».

  • Есть библиотека звуков для создании аудио и видео — от стука дождя до звонка в дверь. Их ищут через телеграм-бот. Например, если нужен звук разбитой бутылки, надо написать об этом боту — и он отправит ссылку с несколькими вариантами.

Источник: Telegram
Источник: Telegram
Источник: «Звукограм»
Источник: «Звукограм»

Бесплатные опции

  • После регистрации пользователь получает 10 токенов в подарок. Их должно хватить на озвучку примерно 1800 символов голосами Pro или 10 000 символов обычными голосами.

  • Если пользователь пригласит друга по ссылке, он будет получать один токен за каждые 10 рублей, которые потратит его друг.

Сколько стоит

  • Один токен равен одному рублю.
  • Всего шесть тарифов. Например, 150 токенов стоят 150 рублей, а 3600 токенов — 3600 рублей.
  • Есть возможность перевести любую сумму на депозит.
  • Каждый голос стоит определённое количество токенов. Пример с расценками — на скрине ниже.
  • Разобраться с системой списания токенов непросто. Разработчики советуют сразу разбивать текст разделителями, потому что если, к примеру, пользователь решит в одном месте добавить паузу, «Звукограм» снова спишет токены за весь текст. Подробнее о том, как пользоваться токенами и не разориться, — здесь.

Источник: «Звукограм»

SteosVoice (CyberVoice)

Веб-версия и телеграм-бот

Источник: Telegram
Источник: Telegram
  • В библиотеке — сотни голосов, в том числе персонажей. Например, можно выбрать Железного Человека или рассказчика из Warcraft. Загружать файлы для озвучки можно.
  • Есть возможность выбрать англоязычного спикера и озвучить им текст на русском.
  • Одна из основных целевых аудиторий сервиса — блогеры и контент-мейкеры. Среди клиентов сервиса — ютуб-каналы, онлайн-школы и разработчики игр, например Cut The Crap, Gabe Follower, «Брайт», Skillbox, Norllina Studio.
  • Есть монетизация: можно оцифровать свой голос и получать отчисления с каждой его генерации. Но принимают не всех желающих — нужно пройти тестирование.

Бесплатные опции

  • Телеграм-бот — бесплатный.
  • 2000 символов для синтезирования ежедневно. Максимальная длина текста — 350 символов. Всё, что свыше, стоит денег. Есть и другие ограничения, подробнее — в FAQ сервиса.

Сколько стоит

  • Веб-версия: от 200 до 700 рублей в месяц.
  • Ещё есть три специальных тарифа, в том числе корпоративный. Цена по запросу.

Источник: SteosVoice

APIHOST

Источник: APIHOST
Источник: APIHOST
  • Более 1000 голосов — от Левитана до Санта-Клауса.
  • Загружать файлы для озвучки нельзя.
  • Чтобы пользоваться сервисом бесплатно, не нужно регистрироваться.

Бесплатные опции

  • Есть несколько бесплатных голосов.

Сколько стоит

  • Есть восемь тарифов: можно платить за каждый символ (от 0,6 рублей за 1000 символов) или взять безлимит (от 5000 рублей в месяц). Чем реалистичнее голос — тем он дороже.
  • Чтобы купить подписку, нужно зарегистрироваться. В платных версиях доступно на +500 голосов больше, чем в бесплатной.

Источник: APIHOST

AI Search

Источник: AI Search
Источник: AI Search
  • Доступно 152 языка и 1052 спикера.
  • Загружать файлы с текстом нельзя.
  • Помимо озвучки есть возможность генерировать тексты, картинки и транскрибировать аудио.

Бесплатные опции

  • Максимальное число символов в тексте для озвучки в день — 1000.

Сколько стоит

  • Тарифов больше 20: пользователям предлагают платить за период (месяц, три месяца, полгода), количество символов или затраченное время. Например, месячная подписка стоит 499 рублей, в неё входят 10 000 символов в день, а если их не хватит — нужно докупать символы. Все цены — здесь.
Источник: AI Search
Источник: AI Search

PlayHT

Источник: PlayHT
Источник: PlayHT
  • Больше 900 голосов и свыше 100 языков, в том числе русский. Есть даже разные акценты, например южный.
  • Добавлена возможность записать голос самому и синтезировать с ним текст на английском языке. Скоро добавятся другие языки.
  • Есть голоса знаменитостей и персонажей: от Арнольда Шварцнеггера и Опры Уинфри до Губки Боба и Дарта Вейдера.
  • Сервисом пользуются Amazon, Reuters, Hyundai и другие.

Бесплатные опции

  • Доступ ко всем голосам.
  • Один голос, записанный самим пользователем.
  • Максимальное количество символов — 12 500 в месяц.

Сколько стоит

  • От $39 в месяц.
  • 3 тарифа, в том числе корпоративный.
  • Оплата за месяц или год вперёд картой иностранного банка.
Источник: PlayHT
Источник: PlayHT

Typecast

Источник: Typecast
Источник: Typecast
  • Более 160 голосов.
  • Подходит для озвучки английских текстов, голоса на русском синтезируются с акцентом. Поэтому если нужен другой язык — надо тестировать.
  • Генерация только с помощью текста, добавлять медиафайлы нельзя.
  • Есть опция синтезирования своего голоса.

Бесплатные опции

  • Доступно 100+ голосов.
  • Скачивание до 5 минут озвученного контента в месяц.

Сколько стоит

  • От $8,89 в месяц.
  • 3 платных тарифа, в том числе для бизнеса.
  • Оплата зарубежной картой за месяц или год.
Источник: Typecast
Источник: Typecast

Clipchamp

Веб-версия, мобильное приложение для iOS, десктопное приложение

Источник: Clipchamp
Источник: Clipchamp
  • Clipchamp разработали в Microsoft. В первую очередь он позиционирует себя как ИИ для генерации видео.
  • Сервисом пользуются больше миллиона пользователей. Среди крупных клиентов: Amazon, Google, Spotify.
  • Более 400 голосов и больше 80 языков, в том числе русский.
  • Есть возможность озвучить текст длиною в 10 минут (примерно 1500 слов). Если нужно дольше — достаточно просто создать несколько таких аудио, говорят разработчики.
  • Загружать файлы нельзя, но можно накладывать аудио на видеоролики, созданные в Clipchamp. Инструкция — здесь.

Бесплатные опции

  • Есть все функции для озвучки.

Сколько стоит

  • От €11,99 в месяц.
  • Один тариф Premium.
  • Оплата за месяц или год вперёд картой иностранного банка.
  • Доступны разные функции для генерации видео и картинок, но опции для синтезирования голоса те же самые. Поэтому, если кроме озвучки ничего не надо, покупать подписку не нужно вообще.
Источник: Clipchamp
Источник: Clipchamp

Oddcast

Источник: Oddcast
Источник: Oddcast
  • При озвучке пользователь выбирает анимированного персонажа, который будет произносить текст, — этим Oddcast отличается от других сервисов. Подразумевается, что пользователь сможет использовать созданного персонажа в коммерческих целях — например, разместить на сайте.
  • Больше 20 языков, в том числе русский. Доступны 3 русских голоса: один мужской и два женских.
  • Загружать файлы нельзя.

Бесплатные опции

  • Есть бесплатный 15-дневный тестовый период.

Сколько стоит

  • От $10,79 в месяц.
  • 4 тарифа.
  • Оплатить картой российского банка нельзя.
Источник: Oddcast
Источник: Oddcast

А вы озвучиваете тексты с помощью нейросетей? Каким сервисом пользовались?

77
3 комментария

Спасибо за подборку! Пробовала, но не помню какую именно нейронку. Прям слышно, что это робот, хотя сам голос приятный, вполне человеческий. Но что-то не так с произношением звуков, стыками между словами. В общем, жуть :) с текстами такая же беда у ИИ, писала у себя об этом. А вот видео и картинки прям топово получаются, очень нравится

1
Ответить

Да, интонации робота часто попадаются. Но если нужно озвучить ролик для социальных сетей или сделать субтитры, то очень выручают нейросети) А для картинок чем пользуетесь?

Ответить