Nexia — это не «Нехийа»: как мы научили нейросеть говорить на узбекском языке

Узбекский — сложный язык для обучения нейронной модели. В нём используется латиница, но не все буквы звучат так, как в английском, а ещё язык постоянно меняется. Елена Белоброва, руководитель направления по развитию бизнеса ML-сервисов Yandex Cloud, рассказывает, как удалось научить нейросеть распознавать и синтезировать речь на узбекском языке.

Синтезируемая фраза переводится так: «Последний звонок — это не только последний день школьного образования, но и время для принятия выпускниками серьёзного и важного решения».
1313

Например, «X» — это твёрдый звук «х», и автомобиль Nexia синтез прочитает не как «Нэксия», а как «Нехийа»,

Именно твердый? Тогда может «Нехыйа» или «Нехъийа»?