{"id":14274,"url":"\/distributions\/14274\/click?bit=1&hash=fadd1ae2f2e07e0dfe00a9cff0f1f56eecf48fb8ab0df0b0bfa4004b70b3f9e6","title":"\u0427\u0435\u043c \u043c\u0443\u0440\u0430\u0432\u044c\u0438\u043d\u044b\u0435 \u0434\u043e\u0440\u043e\u0436\u043a\u0438 \u043f\u043e\u043c\u043e\u0433\u0430\u044e\u0442 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u0438\u0441\u0442\u0430\u043c?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"6fbf3884-3bcf-55d2-978b-295966d75ee2"}

«Яндекс» добавил автоматический перевод любых англоязычных видео в YouTube и других сервисах в «Браузере» Статьи редакции

Перевод закадровый.

Благодаря технологии пользователи смогут смотреть ролики на английском языке с закадровым переводом на русском, рассказали vc.ru в компании. «Яндекс» показал прототип закадрового перевода видео в июле, но тогда он работал на ограниченном списке роликов и только в десктопном «Яндекс.Браузере».

Теперь пользователи могут перевести почти любое записанное видео на английском языке на YouTube, Vimeo, TikTok, Twitter, Facebook и «ВКонтакте». Ограничения действуют на лицензионный контент — например, сериал Netflix сервис не переведёт.

Пример работы закадрового перевода «Яндекс»

Перевод доступен в «Браузере» для Windows, macOS, Linux и Android и в приложении «Яндекс» для Android и iOS. Чтобы посмотреть видео в русской озвучке, нужно нажать на кнопку в плеере — процесс перевода занимает несколько минут, после чего пользователь получит уведомление.

Пользователям доступно два голоса — женский (помощника «Алиса») и мужской. Пока перевод доступен только для видео на английском, но в будущем компания планирует добавить и другие языковые пары.

Полностью стереть языковые границы в интернете — одна из наших главных задач. Мы приступили к её решению ещё в 2011 году, и сейчас умеем переводить все основные виды контента: текст, изображения, видео. Дальше мы будем добавлять в перевод видео новые языковые пары и голоса, помогая людям узнавать новое и получать от этого удовольствие.

Роман Иванов, руководитель «Яндекс.Браузера»

Перевод роликов происходит в несколько этапов: распознавание речи, превращение её в текст и с помощью нейросетей разбивка на предложения. Затем алгоритмы определяют пол говорящего, переводят предложения на русский язык и синтезируют голос, после чего совмещают перевод с видеорядом.

0
450 комментариев
Написать комментарий...
Yaroslav Gryaznov

5-6 лет осталось профессии переводчика

Ответить
Развернуть ветку
Всвиторе

Ага, сказки. Кто как думаешь помогает разрабатывать качественные модели для перевода Яндексу? Правильно, профессиональные переводчики. Веб-макаки из яндекса с их B1-B2 разве что могут осилить перевод на уровне GTA SA. Не в обиду.

Исчезновение переводчиков не произойдет никогда, а вот и без того низкий уровень знания иностранных языков у россиян пробьёт дно в будущем. 

Ответить
Развернуть ветку
fffggg gggfff

вы похоже не в курсе как ML работает. основные прорывы последних лет идут на самообучении, а не на моделях от людей.
хана не только переводчикам, но и всем edtech конторкам типа skyeng

Ответить
Развернуть ветку
Jaroslav Michailov

Не, перевод худлита и некоторой гуманитарной литературы машинным быть не может, к сожалению или к счастью, потому что ее нельзя перевести дословно (она не про передачу информации), и нужно искать решения для локализации текстов в нашем культурно-интеллектуальном контексте. Опыт показывает, что редактура перевода МЛ требует больших когнитивных усилий, чем перевод с чистого листа человеком в этой области.

Переводчики останутся, но их станет меньше, и они будут профессиональнее. А то, для чего сейчас применяется МЛ на рынке, и не стоит трудов хорошего переводчика.

Ответить
Развернуть ветку
Denis Kiselev

Вопрос в тюнинге моделей для перевода. Да, у переводчика - все существенно тренировано. Но машинные модели тоже можно научить художественному переводу - как раз в этом и есть фишка нейронных сетей: они очень четко адаптируются под контекст - жанр там, или даже стиль. Но нужны модели, да

Ответить
Развернуть ветку
Jaroslav Michailov

Вряд ли тут можно создать устойчивую модель, только если под каждого конкретного автора, по заветам герменевтики. Попробуйте, создав модель для рамок жанра, а не рамок конкретного автора, перевести Пруста. Или Беккета. Или Делёза. Или Канта с Гегелем, или посовременней — Альтюссера с Бурдье, да того же Латура. Такую обобщающую модель попросту невозможно настроить из-за обилия вводимых словообразований, конкретных уникальных метафор и преемственности языка и концептов (из латыни, греческого и проч.).

Такие модели подойдут для условной средней руки книги про менеджмент, одинаковых с точки зрения формы статей по биологии/социологии/прочих  наук, где унифицирован формат (структура и язык) конечного продукта ученого, для ширпотребного фентези или мусора про оптимизацию работы мозга для айтишников. Для всего, что пишется по конвееру. Серьезную литературу можно обложить моделью, но только в пределах конкретного автора.

Ответить
Развернуть ветку
Denis Kiselev

Я не настолько большой специалист в конфигурировании и архитектуре нейросетей, но «стиль» автора - это вполне себе параметр, который может становится одним из слоев обработки текста.

То есть, нейросеть в состоянии воспринять особенности «слога» Канта или Пруста. То есть - распознать эти особенности. И, например, «узнать» - кому принадлежит авторство того или иного текста.

Далее - каким образом соединить восприятие этого «слога» и сделать соответствующий «тюнинг» перевода - это тоже сложно, но в теории - возможно.

Ответить
Развернуть ветку
Jaroslav Michailov

Да, про это и речь. Я как раз говорил, что подводить подобных авторов под параметры более общие, какого-то жанра или области знаний, заведомо бесполезное дело. Хотя и сам автор от работы к работе вещь довольно нестабильная и текучая. Ну и про ту же возможность параметризации поэзии тоже давно открытый вопрос.

Ответить
Развернуть ветку
Denis Kiselev

На практике знакомясь с возможностями нейросетей искать закономерности в данных, я не был бы так уверен насчёт стиля. Все поддаётся обучению: и текучесть автора в том числе.

Учитывая, что данных здесь огромное количество, и они - оцифрованы (тексты же!), плюс есть разного качества Переводы - все это создаёт вполне годную базу для формирования мат моделей именно художественного перевода. Да, архитектура сетей будет не простой - но это более чем реально.

Ответить
Развернуть ветку
447 комментариев
Раскрывать всегда