{"id":14274,"url":"\/distributions\/14274\/click?bit=1&hash=fadd1ae2f2e07e0dfe00a9cff0f1f56eecf48fb8ab0df0b0bfa4004b70b3f9e6","title":"\u0427\u0435\u043c \u043c\u0443\u0440\u0430\u0432\u044c\u0438\u043d\u044b\u0435 \u0434\u043e\u0440\u043e\u0436\u043a\u0438 \u043f\u043e\u043c\u043e\u0433\u0430\u044e\u0442 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u0438\u0441\u0442\u0430\u043c?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"6fbf3884-3bcf-55d2-978b-295966d75ee2"}

«Яндекс» добавил автоматический перевод любых англоязычных видео в YouTube и других сервисах в «Браузере» Статьи редакции

Перевод закадровый.

Благодаря технологии пользователи смогут смотреть ролики на английском языке с закадровым переводом на русском, рассказали vc.ru в компании. «Яндекс» показал прототип закадрового перевода видео в июле, но тогда он работал на ограниченном списке роликов и только в десктопном «Яндекс.Браузере».

Теперь пользователи могут перевести почти любое записанное видео на английском языке на YouTube, Vimeo, TikTok, Twitter, Facebook и «ВКонтакте». Ограничения действуют на лицензионный контент — например, сериал Netflix сервис не переведёт.

Пример работы закадрового перевода «Яндекс»

Перевод доступен в «Браузере» для Windows, macOS, Linux и Android и в приложении «Яндекс» для Android и iOS. Чтобы посмотреть видео в русской озвучке, нужно нажать на кнопку в плеере — процесс перевода занимает несколько минут, после чего пользователь получит уведомление.

Пользователям доступно два голоса — женский (помощника «Алиса») и мужской. Пока перевод доступен только для видео на английском, но в будущем компания планирует добавить и другие языковые пары.

Полностью стереть языковые границы в интернете — одна из наших главных задач. Мы приступили к её решению ещё в 2011 году, и сейчас умеем переводить все основные виды контента: текст, изображения, видео. Дальше мы будем добавлять в перевод видео новые языковые пары и голоса, помогая людям узнавать новое и получать от этого удовольствие.

Роман Иванов, руководитель «Яндекс.Браузера»

Перевод роликов происходит в несколько этапов: распознавание речи, превращение её в текст и с помощью нейросетей разбивка на предложения. Затем алгоритмы определяют пол говорящего, переводят предложения на русский язык и синтезируют голос, после чего совмещают перевод с видеорядом.

0
450 комментариев
Написать комментарий...
Yaroslav Gryaznov

5-6 лет осталось профессии переводчика

Ответить
Развернуть ветку
Всвиторе

Ага, сказки. Кто как думаешь помогает разрабатывать качественные модели для перевода Яндексу? Правильно, профессиональные переводчики. Веб-макаки из яндекса с их B1-B2 разве что могут осилить перевод на уровне GTA SA. Не в обиду.

Исчезновение переводчиков не произойдет никогда, а вот и без того низкий уровень знания иностранных языков у россиян пробьёт дно в будущем. 

Ответить
Развернуть ветку
fffggg gggfff

вы похоже не в курсе как ML работает. основные прорывы последних лет идут на самообучении, а не на моделях от людей.
хана не только переводчикам, но и всем edtech конторкам типа skyeng

Ответить
Развернуть ветку
Jaroslav Michailov

Не, перевод худлита и некоторой гуманитарной литературы машинным быть не может, к сожалению или к счастью, потому что ее нельзя перевести дословно (она не про передачу информации), и нужно искать решения для локализации текстов в нашем культурно-интеллектуальном контексте. Опыт показывает, что редактура перевода МЛ требует больших когнитивных усилий, чем перевод с чистого листа человеком в этой области.

Переводчики останутся, но их станет меньше, и они будут профессиональнее. А то, для чего сейчас применяется МЛ на рынке, и не стоит трудов хорошего переводчика.

Ответить
Развернуть ветку
Denis Kiselev

Вопрос в тюнинге моделей для перевода. Да, у переводчика - все существенно тренировано. Но машинные модели тоже можно научить художественному переводу - как раз в этом и есть фишка нейронных сетей: они очень четко адаптируются под контекст - жанр там, или даже стиль. Но нужны модели, да

Ответить
Развернуть ветку
Кирилл

Вопрос в вычислительной мощности пк, которая пока не тянет нейросеть сложностью с мозг человека.

Ответить
Развернуть ветку
Denis Kiselev

Мы с вами же не о замене мозга человека говорим - а о достаточно узкой функциональной области перевода.

Далее - использование ПК в таких системах не предполагается. Есть сервера в облаке с любой мощностью. Нейросеть ресурмоемко учить. Уже сформированная нейросеть не требует таких ресурсов, и может выполняться на специализированном железе с огромной скоростью (пример - м1)

Ответить
Развернуть ветку
Кирилл

Если говорить о качественном полноценном переводе художественных текстов, то как раз о замене мозга. Это не "маленькая функциональнвя область".

Там выше или ниже уже писали про это: полноценный перевод - это не замена слов одного языка на другие.

Для полноценного перевода нужно работать не со словами, а со смыслами.

И на это пока не способна ни одна нейросеть. Ни на ПК, ни на суперкомпьютере.

Пример.

"Джон вошёл в дверь, вспоминая, как именно в этом месте он неловко оступился на глазах у Жаннет. Красный, как помидор, он поднялся с пола, стараясь не глядеть по сторонам".

Чтобы правильно транслировать на другой язык этот отрывок, необходимо понимать, что испытывал Джон (смущение), потому что от этого зависит, как перевести фразеологизм "красный, как помидор".

Так как он может означать" цвет помидора" дословно, может означать цвет смущения, а может означать цвет гнева.

И более правильным переводом на английский этой фразы будет, вероятно, "покраснел, как свёкла".

И это только небольшой пример, в реальности все гораздо сложнее.

Машинный перевод поможет понять примитивный текст, но для полноценного перевода нужно, чтобы нейросеть работала со смыслами. То есть была полноценным ИИ, до которого как до Китая ещё.

Ответить
Развернуть ветку
Denis Kiselev

Если посмотреть на функции и возможности головного мозга человека, то в масштабах этого ракурса перевод текстов будет той самой небольшой функциональной областью.

По вашему примеру я могу сделать вывод о том, что вы не знакомы с работой нейросетей. Напомню, что современные нейросеть пишут тексты. Сами. По теме.

Ответить
Развернуть ветку
Кирилл

Я не особо вдавался, но я достаточно информирован.

Тексты, которые они "сами" пишут, абсолютно не имеют смысла - они только выглядят, как что-то осмысленное(если они не больше нескольких предложений, в противном случае они и выглядят чушью). Они представляют собой речь попугая, который комбинирует слова в определённой последовательности в зависимости от некоторого числа заданных условий.

Это задача примитивная, абсолютно другого уровня, чем полноценный перевод текста.

Скорее, вы не понимаете принципиальных качественных отличий GPT3 от мозга, если привели её в пример.

Ну и, да. Перевод текста - это одна из самых сложных задач, +- наравне со свободным творчеством., которая максимально задействует мозг.

Ответить
Развернуть ветку
Denis Kiselev

Приведу другой пример возможной технологии.

Берём нейросеть, которая делает перевод дословный. Сравниваем с художественным переводом, выделяем «непохожие места». Получаем исходный набор данных для обучения «художественному переводу».

В общем - я не специалист, специалист вам на порядок больше возможностей изложит. Возможности технологии велики

Ответить
Развернуть ветку
Кирилл

Вы совсем не о том пишете, к сожалению.

Так сделать нельзя, это качественно другая технология.

Чтобы сделать хороший перевод, нужно понять смысл фраз, чтобы понять смысл фраз, нужно обладать ИИ на уровне +- человеческого.

Иначе это подбор слов на основе других слов. Это абсолютно не подходит как для перевода, так и для полноценной творческой работы. Даже с небольшим текстом, что уж говорить про роман, например.

GPT3 пока может дать псевдоосмысленный ответ в несколько предложений.
Для работы на уровне переводчика нужна другая архитектура и абсолютно другие мощности.

Ответить
Развернуть ветку
Denis Kiselev

А я думаю, вы недооцениваете машинное обучение и объемы данных.

Смысл фраз - это в определенном виде сегментация из имеющегося поля сущностей. И вы недооцениваете - какого уровня связанности могут генерироваться сущности. Речь не идёт о словах, или связанных словах. Речь будет идти о фразах или кусках текста.

Человек, в сущности, мыслит походим образом, облекая образы и мысли в слова.

Думаю, мы спорим зря. Вы останетесь при своей точке зрения, я - при своей. Критерий истины - практика. Посмотрим как быстро и как качественно нейросети станут делать переводы. Особо долго ждать не прийдется, кмк

Ответить
Развернуть ветку
Denis Kiselev

Я вам привёл пример технологии.

Речь наполняется смыслом, как только мы подаём «смысл на вход».

Пример конфигурации нейросети.

У нас есть нейросеть, которая узнаёт стиль текста и его автора. У нас есть нейросеть, которая делает смысловой перевод. У нас есть нейросеть, которая излагает текст в стиле определенного переводчика. Комбинируем их - и получаем «художественного переводчика». Сочетание генеративных сетей и «обычных», но обученных на больших массивах данных.

Перевод - не особо сложнее управления автомобилем. А это нейросети тоже умеют, просто денег туда вложено больше и есть практические результаты

Ответить
Развернуть ветку
Кирилл

Технологии абсолютно другого уровня, чем необходима.

Смысл нельзя "подать на вход". Его можно сформулировать объёмом взаимосвязанных данных. Но мощностей пока не хватит.

Ещё раз, пока что нет нейросети, которая делает сколь-либо полноценный перевод и работает со смыслами на уровне человека.
Достигнутый максимум - учитывать слова из нескольких предыдущих предложений. Такое себе.

Про остальные ваши пункты тоже есть сомнения, но это отдельные темы.

Ответить
Развернуть ветку
Denis Kiselev

Про несколько слов в предложении - вы оперируете уровнем PROMT лет 15 назад. Это прям совсем не так.

Про смысл вы верно сказали - его именно связанным набором понятий можно представить. Это похоже на выход из одной из нейросетей. Не понял откуда взялся тезис «нельзя подать на вход». Как раз вместо набора текста на вход генеративной нейросети его и можно направить.

Не понял - каких мощностей не хватает то? На что?

Ответить
Развернуть ветку
447 комментариев
Раскрывать всегда