«Яндекс» добавил автоматический перевод любых англоязычных видео в YouTube и других сервисах в «Браузере» Статьи редакции
Перевод закадровый.
Благодаря технологии пользователи смогут смотреть ролики на английском языке с закадровым переводом на русском, рассказали vc.ru в компании. «Яндекс» показал прототип закадрового перевода видео в июле, но тогда он работал на ограниченном списке роликов и только в десктопном «Яндекс.Браузере».
Теперь пользователи могут перевести почти любое записанное видео на английском языке на YouTube, Vimeo, TikTok, Twitter, Facebook и «ВКонтакте». Ограничения действуют на лицензионный контент — например, сериал Netflix сервис не переведёт.
Перевод доступен в «Браузере» для Windows, macOS, Linux и Android и в приложении «Яндекс» для Android и iOS. Чтобы посмотреть видео в русской озвучке, нужно нажать на кнопку в плеере — процесс перевода занимает несколько минут, после чего пользователь получит уведомление.
Пользователям доступно два голоса — женский (помощника «Алиса») и мужской. Пока перевод доступен только для видео на английском, но в будущем компания планирует добавить и другие языковые пары.
Перевод роликов происходит в несколько этапов: распознавание речи, превращение её в текст и с помощью нейросетей разбивка на предложения. Затем алгоритмы определяют пол говорящего, переводят предложения на русский язык и синтезируют голос, после чего совмещают перевод с видеорядом.
5-6 лет осталось профессии переводчика
Ага, сказки. Кто как думаешь помогает разрабатывать качественные модели для перевода Яндексу? Правильно, профессиональные переводчики. Веб-макаки из яндекса с их B1-B2 разве что могут осилить перевод на уровне GTA SA. Не в обиду.
Исчезновение переводчиков не произойдет никогда, а вот и без того низкий уровень знания иностранных языков у россиян пробьёт дно в будущем.
вы похоже не в курсе как ML работает. основные прорывы последних лет идут на самообучении, а не на моделях от людей.
хана не только переводчикам, но и всем edtech конторкам типа skyeng
Не, перевод худлита и некоторой гуманитарной литературы машинным быть не может, к сожалению или к счастью, потому что ее нельзя перевести дословно (она не про передачу информации), и нужно искать решения для локализации текстов в нашем культурно-интеллектуальном контексте. Опыт показывает, что редактура перевода МЛ требует больших когнитивных усилий, чем перевод с чистого листа человеком в этой области.
Переводчики останутся, но их станет меньше, и они будут профессиональнее. А то, для чего сейчас применяется МЛ на рынке, и не стоит трудов хорошего переводчика.
Вопрос в тюнинге моделей для перевода. Да, у переводчика - все существенно тренировано. Но машинные модели тоже можно научить художественному переводу - как раз в этом и есть фишка нейронных сетей: они очень четко адаптируются под контекст - жанр там, или даже стиль. Но нужны модели, да
Вряд ли тут можно создать устойчивую модель, только если под каждого конкретного автора, по заветам герменевтики. Попробуйте, создав модель для рамок жанра, а не рамок конкретного автора, перевести Пруста. Или Беккета. Или Делёза. Или Канта с Гегелем, или посовременней — Альтюссера с Бурдье, да того же Латура. Такую обобщающую модель попросту невозможно настроить из-за обилия вводимых словообразований, конкретных уникальных метафор и преемственности языка и концептов (из латыни, греческого и проч.).
Такие модели подойдут для условной средней руки книги про менеджмент, одинаковых с точки зрения формы статей по биологии/социологии/прочих наук, где унифицирован формат (структура и язык) конечного продукта ученого, для ширпотребного фентези или мусора про оптимизацию работы мозга для айтишников. Для всего, что пишется по конвееру. Серьезную литературу можно обложить моделью, но только в пределах конкретного автора.
Я не настолько большой специалист в конфигурировании и архитектуре нейросетей, но «стиль» автора - это вполне себе параметр, который может становится одним из слоев обработки текста.
То есть, нейросеть в состоянии воспринять особенности «слога» Канта или Пруста. То есть - распознать эти особенности. И, например, «узнать» - кому принадлежит авторство того или иного текста.
Далее - каким образом соединить восприятие этого «слога» и сделать соответствующий «тюнинг» перевода - это тоже сложно, но в теории - возможно.
Да, про это и речь. Я как раз говорил, что подводить подобных авторов под параметры более общие, какого-то жанра или области знаний, заведомо бесполезное дело. Хотя и сам автор от работы к работе вещь довольно нестабильная и текучая. Ну и про ту же возможность параметризации поэзии тоже давно открытый вопрос.
На практике знакомясь с возможностями нейросетей искать закономерности в данных, я не был бы так уверен насчёт стиля. Все поддаётся обучению: и текучесть автора в том числе.
Учитывая, что данных здесь огромное количество, и они - оцифрованы (тексты же!), плюс есть разного качества Переводы - все это создаёт вполне годную базу для формирования мат моделей именно художественного перевода. Да, архитектура сетей будет не простой - но это более чем реально.