Yandex Cloud запустил нейросеть, способную «понимать» одновременно 10 языков Статьи редакции
Она переключается автоматически в зависимости от ответов.
- Нейросеть Yandex Cloud может распознавать более 10 языков одновременно, объявила компания. С помощью неё можно создавать многоязычных голосовых помощников и роботов для колл-центров с большим потоком клиентов.
- Например, нейросеть работает с английским, французским, датским, финским, турецким и другими языками. Модель распознаёт речь на любую тему — короткие и длинные фразы, имена, адреса, даты и числа. Она может переключаться между языками в любой момент разговора.
- Нейросеть работает на базе архитектуры Transformer — обрабатывает вводные слова параллельно и независимо друг от друга, поэтому быстро обучается. Её готовили на десятках терабайтов данных из датасетов и сервисов и приложений «Яндекса».
- Многоязычная модель работает в сервисе синтеза и распознавания речи Yandex SpeechKit. Его используют больше 1000 клиентов, например, X5 Group и «Додо Пицца». Настроить можно стандартными средствами в API.
3
показа
6.5K
открытий
5
репостов
Список языков где-то есть?
На сайте самого SpeechKit (https://cloud.yandex.ru/services/speechkit) нигде не нашёл упоминания 10 языков, на тестовом стенде только русский английский и турецкий.
В Тасс (https://tass.ru/ekonomika/15080593) чуть уточняют:
Новая нейросеть работает как с самыми распространенными языками - английским, французским, так и с другими - датским, финским, турецким.И всё же, о каких именно 10 языках идёт речь?
Список языков в доке: https://cloud.yandex.ru/docs/speechkit/stt/models
ru-RU (по умолчанию) — русский язык;
kk-KK — казахский язык.
Модель general:rc также поддерживает языки:
"en-US" — английский язык;
"de-DE" — немецкий язык;
"fr-FR" — французский язык;
"fi-FI" — финский язык;
"sv-SE" — шведский язык;
"da-DK" — датский язык;
"pl-PL" — польский язык;
"it-IT" — итальянский язык;
"es-ES" — испанский язык;
"pt-PT" — португальский язык;
"tr-TR" — турецкий язык;
"auto" — автоматическое распознавание языка.