Nexia — это не «Нехийа»: как мы научили нейросеть говорить на узбекском языке

Узбекский — сложный язык для обучения нейронной модели. В нём используется латиница, но не все буквы звучат так, как в английском, а ещё язык постоянно меняется. Елена Белоброва, руководитель направления по развитию бизнеса ML-сервисов Yandex Cloud, рассказывает, как удалось научить нейросеть распознавать и синтезировать речь на узбекском языке.

Синтезируемая фраза переводится так: «Последний звонок — это не только последний день школьного образования, но и время для принятия выпускниками серьёзного и важного решения».
1313

Узбекский — сложный язык для обучения нейронной модели. В нём используется латиница, но не все буквы звучат так, как в английском, а ещё язык постоянно меняется. Да это же рокет сайнс, и как вы справились с такой задачей! Никакой больше язык не имеет отличий в звучании символов латиницы от английского и никакой больше язык на планете не меняется постоянно! Только узбекский и язык наави с Пандоры.

2

Как, как. Наняли 100500 таджиков как обычно в РФ это делается.