Meta* представила нейросеть SeamlessM4T, которая умеет распознавать речь и переводить её на 100 языков Статьи редакции
Модель может переводить с одного языка на другой и выдать результат в текстовом или аудиоварианте.
- SeamlessM4T — нейросеть, которая умеет распознавать речь, преобразовывать её в текст и переводить на около 100 языков. Также модель умеет создавать из текста речь на 35 языках.
- Нейросеть доступна для исследователей по лицензии с открытым исходным кодом, вместе с SeamlessAlign — набором данных для перевода, который содержит 270 часов записи речи и соответствующие ей тексты.
- SeamlessM4T может распознавать, когда человек переходит с одного языка на другой или использует в речи сразу несколько: например, телугу, хинди и английский.
- Модель основана на предыдущих проектах Meta* для переводов: например, системе прямого перевода между языками, ИИ-переводчике для диалекта хоккеин, у которого нет письменного варианта, и других.
*Meta признана экстремистской организацией и запрещена в России.
15K
показов
8.4K
открытий
4
репоста
Лет через 5-10 перейдем на девайсы как в фантастических фильмах, которые будут все носить на шее/ухе и которые будут определять язык собеседника и переводить диалог в оба направления...
Нам нужна новая фантастика, так как большая часть технологий из этого жанра уже имеется ))
Комментарий недоступен
Не заменят, эта технология не сможет выстрелить в массы, пока не решит свои болячки (автономность, габариты и т.д.)