Попробовал 6 сервисов и Python-библиотек text-to-speech (TTS), делюсь результатами

Всем привет! Меня зовут Александр Троицкий, я автор канала AI для чайников, и в этой статье я расскажу про мой опыт работы с разными сервисами TTS.

9

Вообще непонятно о чем обзор)

1. какие критерии отбора в этот шортлист?
2. какой язык?
3. где silero? Nemo? Какие-нибудь платные от Яндекса и даже Тинькофф или Speechify?
4. а если уж хорошо отбирать, то есть еще опция еще самому потренить Flowtron/Fastspeech/Tacotron, но да, это сильно опционально)
5. насколько я знаю, уже половина ютуба автоматизирована, по крайней мере в шортсах одни и те же голоса. Что за сервис их генерит? Вот это было бы полезно узнать)
6. что вообще сравниваем-то?)

ConquiCoqui

TesorFlowTTSTensorFlowTTS

4
Ответить

спасибо за отзыв! буду учиться писать лучше.

1. я просто погуглил какое-то время и попробовал их в действии. пробовал те, кто были на первых местах в гугле по "text-to-speech python"
2. хорошее замечание, добавил в статью. это Python
3. Яндекс, Тинькофф, silero, Nemo мне не попались, когда я гуглил. Speechify знаю, не успел попробовать. Посмотрю их, спасибо за дополнение.
4. это скорее статья для чайников-новичков, а не дип лернинг специалистов.
5. можете прислать пример?
6. добавил таблицу - быстрый вывод по критериям в начале статьи. вы правы, надо было сделать этот вывод более явным.

Ответить

Вы написали о Flowtron, Fastspeech и Tacotron, в чем между ними принципиальная разница, кроме того, что их нужно самому тренировать. Вы работали с ними?

Ответить