Yandex Cloud запустил нейросеть, способную «понимать» одновременно 10 языков Статьи редакции

Она переключается автоматически в зависимости от ответов.

  • Нейросеть Yandex Cloud может распознавать более 10 языков одновременно, объявила компания. С помощью неё можно создавать многоязычных голосовых помощников и роботов для колл-центров с большим потоком клиентов.
  • Например, нейросеть работает с английским, французским, датским, финским, турецким и другими языками. Модель распознаёт речь на любую тему — короткие и длинные фразы, имена, адреса, даты и числа. Она может переключаться между языками в любой момент разговора.
  • Нейросеть работает на базе архитектуры Transformer — обрабатывает вводные слова параллельно и независимо друг от друга, поэтому быстро обучается. Её готовили на десятках терабайтов данных из датасетов и сервисов и приложений «Яндекса».
  • Многоязычная модель работает в сервисе синтеза и распознавания речи Yandex SpeechKit. Его используют больше 1000 клиентов, например, X5 Group и «Додо Пицца». Настроить можно стандартными средствами в API.
0
68 комментариев
Написать комментарий...
Дмитрий Перепёлкин

Список языков где-то есть?

На сайте самого SpeechKit (https://cloud.yandex.ru/services/speechkit) нигде не нашёл упоминания 10 языков, на тестовом стенде только русский английский и турецкий.

В Тасс (https://tass.ru/ekonomika/15080593) чуть уточняют:

Новая нейросеть работает как с самыми распространенными языками - английским, французским, так и с другими - датским, финским, турецким.

И всё же, о каких именно 10 языках идёт речь?

Ответить
Развернуть ветку
Иван Тютюнджи

Список языков в доке: https://cloud.yandex.ru/docs/speechkit/stt/models

ru-RU (по умолчанию) — русский язык;
kk-KK — казахский язык.

Модель general:rc также поддерживает языки:
"en-US" — английский язык;
"de-DE" — немецкий язык;
"fr-FR" — французский язык;
"fi-FI" — финский язык;
"sv-SE" — шведский язык;
"da-DK" — датский язык;
"pl-PL" — польский язык;
"it-IT" — итальянский язык;
"es-ES" — испанский язык;
"pt-PT" — португальский язык;
"tr-TR" — турецкий язык;
"auto" — автоматическое распознавание языка.

Ответить
Развернуть ветку
65 комментариев
Раскрывать всегда