Yandex Cloud запустил нейросеть, способную «понимать» одновременно 10 языков Статьи редакции

Она переключается автоматически в зависимости от ответов.

  • Нейросеть Yandex Cloud может распознавать более 10 языков одновременно, объявила компания. С помощью неё можно создавать многоязычных голосовых помощников и роботов для колл-центров с большим потоком клиентов.
  • Например, нейросеть работает с английским, французским, датским, финским, турецким и другими языками. Модель распознаёт речь на любую тему — короткие и длинные фразы, имена, адреса, даты и числа. Она может переключаться между языками в любой момент разговора.
  • Нейросеть работает на базе архитектуры Transformer — обрабатывает вводные слова параллельно и независимо друг от друга, поэтому быстро обучается. Её готовили на десятках терабайтов данных из датасетов и сервисов и приложений «Яндекса».
  • Многоязычная модель работает в сервисе синтеза и распознавания речи Yandex SpeechKit. Его используют больше 1000 клиентов, например, X5 Group и «Додо Пицца». Настроить можно стандартными средствами в API.
0
68 комментариев
Написать комментарий...
Владимир Писарев

Речевые технологии Яндекса — просто космос! До сих пор вдохновлен переводом роликов на Ютубе через Яндекс.Браузер.

К сожалению, у меня не хватило ума выучить английский и французский, но хочется потреблять контент на этом языке, и даже работать. Вот DeepL и Яндекс отлично помогают. Осталось запустить синхронный перевод в онлайне, чтобы даже можно было залететь на рандомный конф-колл и что-то услышать там.

Ответить
Развернуть ветку
Антон Штадлер

Гугл переводит речь

Ответить
Развернуть ветку
Дмитрий Неизвестный

Ролики онлайн переводит?

Ответить
Развернуть ветку
Антон Штадлер

Речь про конф-колл. Когда речь надо перевести максимально оперативно, буквально в лайве

Ответить
Развернуть ветку
Rnatery

Как переводит и как включить?

Ответить
Развернуть ветку
Антон Штадлер
Ответить
Развернуть ветку
Rnatery

А в конференции как

Ответить
Развернуть ветку
Антон Штадлер

Включаешь микрофон и он переводит речь в текст, все что слышит.
Подключение к сторонним программам через Апи
https://cloud.google.com/media-translation

Ответить
Развернуть ветку
Rnatery

как прямо на компе сделать?

Ответить
Развернуть ветку
Антон Штадлер

Интегрировать Апи в программу, если она позволяет такое. Как ещё ты добавишь надстройку для стороннего сервиса, кроме как по Апи? Все Спичи по такой схеме работают

Ответить
Развернуть ветку
Rnatery

готовая программа есть?

Ответить
Развернуть ветку
65 комментариев
Раскрывать всегда