«Тинькофф» стал продавать корпоративным клиентам свою технологию синтеза и распознавания речи

С помощью Tinkoff VoiceKit можно создавать голосовых помощников, автоматизировать работу колл-центра и озвучивать видеоролики.

14K14K открытий

Интересно, почему с интонацией у них у всех так плохо? Особенно когда интонируется текст знаками препинания. А то и здесь, и на остальных движках создаётся ощущение, что всё что после любого знака препинания, читается как новое предложение, и от этого через пару минут мозг взрывается — хотя сам синтез качественный весьма.

Ответить

нет теории интонации, поэтому все игнорят эту тему

Ответить

Когда синтезатор начнет считывать содержание текста и эмоциональный окрас, тогда можно будет услышать интонацию. Сейчас же это подбор звука к разным сочетаниям символов.

Это очень похоже на то как читает ребенок, когда его заставляют родители. Не важно что, главное издавать звуки которые соответствуют буквам в книге.

Ответить

Интонации, ударение - в этом вся сложность, поэтому синтерзированный голос легко распознать.

Ответить

Наверное, потому что надо сначала научить робота "понимать" смыслы, подтексты. Пока с этим плохо. Хотя для меня (диктора по профессии) безусловно хорошо :)

Ответить