15 лучших нейронок для синтеза речи

RHVoice - голосовой синтезатор с качественными русскими голосами, поддерживает 13 других языков. Работает на Windows, Linux и Android.

ElevenLabs - один из самых продвинутых сервисов – предоставляет библиотеку максимально реалистичных голосов, которые можно настраивать как угодно. Есть клонирование голоса, есть опция создания уникального синтетического голоса с нуля. Можно клонировать свой голос и заставить его говорить на любом из поддерживаемых языков.

Free Text To Speech Online - использует библиотеку Microsoft AI Speech для синтеза речи. Есть два качественных, нейтральных русских голоса, простые настройки темпа и тона, предусмотрено скачивание аудио в mp3.

Mimic - быстрый и легкий голосовой синтезатор, созданный на основе CMU Flite. Можно создавать новые уникальные голоса.

Murf - предоставляет более 120 реалистичных мужских и женских голосов, которые можно настраивать и кастомизировать (придать акцент, например, изменить возраст, темп, тон или эмоциональную окраску). Поддерживает 20+ языков.

Speechify - озвучивает любой текстовый контент, создает уникальные голоса для ИИ-аватаров, на лету переводит и дублирует видео.

Mozilla TTS - включает большой набор обученных моделей. Поддерживает 20+ языков, генерирует нейтральную по эмоциональной окраске реалистичную речь. Можно создавать и обучать свои модели.

Deepgram - сервис использует 4 модели для синтеза гиперреалистичной речи – Nova-2, Enhanced, Base, Whisper Large. Модели, помимо синтеза речи на основе текста, делают суммаризацию и анализ тональности, определяют тематику и намерения.

Tortoise TTS - синтезирует речь с использованием множества реалистичных голосов, учитывает указания на эмоции в тексте, клонирует голос.

Wondercraft AI - располагает библиотекой гиперреалистичных голосов для озвучивания текста, есть опция клонирования голоса. Предусмотрено автоматическое создание транскрипта и заметок. Готовые подкасты можно дублировать на любом из 24 доступных языков.

Coqui - предоставляет 5 гиперреалистичных голосов, поддерживает 7 языков.

Fluxon - 5 реалистичных голосов на выбор, возможность клонировать любой голос по образцу, перевод аудио на другой язык.

PlayHT - генерирует человеческие голоса, неотличимые от настоящих. Имеет редактор для создания уникальных голосов персонажей. Предоставляет огромный выбор голосов – более 800, поддерживает 130+ языков.

VoiceMy - озвучивает текст, клонирует голос, обучает голосовые модели.

Recast AI - превращает лонгриды в сжатые интересные подкасты.

Подписываемся тут

22
5 комментариев

Из всех представленных нейросетей, ни одна не может дать хотя-бы один раз создать свой голос из аудио или видео, бесплатно. Либо плати маны, и пользуйся либо иди нахер, и это обидно.

1

Было бы здорово указать источник, который вдохновил вас на рерайт.
https://proglib.io/p/16-luchshih-neyronok-dlya-sinteza-rechi-2023-11-08

У меня другой источник...