Nexia — это не «Нехийа»: как мы научили нейросеть говорить на узбекском языке

Узбекский — сложный язык для обучения нейронной модели. В нём используется латиница, но не все буквы звучат так, как в английском, а ещё язык постоянно меняется. Елена Белоброва, руководитель направления по развитию бизнеса ML-сервисов Yandex Cloud, рассказывает, как удалось научить нейросеть распознавать и синтезировать речь на узбекском языке.

Синтезируемая фраза переводится так: «Последний звонок — это не только последний день школьного образования, но и время для принятия выпускниками серьёзного и важного решения».
1313

Также на рынок Узбекистана устремились компании из России. В 2022 году российский бизнес открыл в стране 967 предприятий — рекордное количество среди организаций с иностранным капиталом.

Я только не оч понял, это заслуга Узбекистана или правительства Эрефии, что эти галерки поплыли теперь туда?)

Больше 20 лет в стране используется латинский алфавит, но помимо этого есть буквы с характерным для узбекского языка произношением. Например, «X» — это твёрдый звук «х», и автомобиль Nexia синтез прочитает не как

Унылый бред менеджера. Латиница много где, и много где читается по-разному.

Дальше — больше

Вот тут согласен, и больше и дальше )