{"id":14287,"url":"\/distributions\/14287\/click?bit=1&hash=1d1b6427c21936742162fc18778388fc58ebf8e17517414e1bfb1d3edd9b94c0","title":"\u0412\u044b\u0440\u0430\u0441\u0442\u0438 \u0438\u0437 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u0447\u0438\u043a\u0430 \u0434\u043e \u0440\u0443\u043a\u043e\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044f \u0437\u0430 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

«Яндекс Браузер» добавил автоматический перевод видео с китайского языка Статьи редакции

Пока технология работает с видео на YouTube.

  • «Яндекс» научил нейросети переводить видео с китайского и автоматически накладывать русскую озвучку, рассказала компания. В пресс-службе отметили, что теперь есть «достаточная технологическая база» для работы с другими сложными языками — например, корейским и японским.
Источник: «Яндекс»
  • Чтобы научить нейросети, разработчики обработали 1,5 млн видео с помощью специального алгоритма и выбрали 100 тысяч примеров с качественными субтитрами на севернокитайском языке. Соответствие аудио и субтитров важно, потому что по ним нейросеть учится понимать речь, пояснили в компании.
  • На первом этапе перевода нейросети выучили 6500 иероглифов, каждый из которых читается как слог. Чтобы нейросеть научилась их понимать, разработчики закодировали необходимый для работы с китайским словарь в виде 10 тысяч токенов. Один токен равен одному слогу или сочетанию двух слогов. Также нейросеть обучили делить сплошной поток иероглифов на смысловые отрезки, чтобы точнее синхронизировать перевод с речью.
  • Также разработчики обучили нейросети понимать четыре тона, которые в китайском определяют смысл сказанного. Тон — это мелодический рисунок голоса, каждый слог с повышением или понижением голоса может означать разные вещи.
  • «Яндекс Браузер» сам предложит перевести видео с китайского на YouTube после того, как пользователь его откроет. Для этого ему нужно нажать кнопку «Перевести видео». «Чуть позже» компания добавит перевод для китайской видеоплатформы Bilibili.
  • «Яндекс» добавил автоматический закадровый перевод любых англоязычных видео в YouTube и других сервисах в «Браузере» в сентябре 2021 года, а в ноябре — закадровый перевод видео на французском, испанском и немецком. В августе 2022-го — синхронный перевод прямых трансляций.
Переводим видео с китайского

Особенности языка, которые преодолел Яндекс Браузер.

0
298 комментариев
Написать комментарий...
Богдан В.

Занятно, за всю жизнь я ни одного китайского видео не смотрел, кроме трейлеров. Логично - ютуб их не подсовывает в поиске. Итого - насколько эта фича нужна?))

Ответить
Развернуть ветку
Denis Bystruev

Тут главное — тенденция.

Ну да, несмотря на то, что китайцев и испаноговорящих больше, 54% контента в сети — на английском.

Но я помню время, когда доля английского была близка к 99%.

Данные отсюда: https://www.statista.com/chart/amp/4140/low-diversity-of-languages-on-the-web-hinders-accessability/

Ответить
Развернуть ветку
Aleks B

английский сила, все остальное херня

Ответить
Развернуть ветку
muiren

Именно. Никогда тоновый язык не станет популярным. Английский топ.

Ответить
Развернуть ветку
C. Steel

Английский тоже ужасен. Эсперанто - топ. Но идеальный язык никогда не станет популярным, увы.

Ответить
Развернуть ветку
muiren

Во-первых, ничего идеального нет. Во-вторых, если английский ужасен, то что уж тогда говорить про другие языки. Порог вхождения для английского языка куда ниже из-за относительной простоты грамматики.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
C. Steel

Не сказал бы что грамматика английского простая.
Куча времен, всякие странные конструкции вроде have had и прочие артикли.
Орфография так вообще упорота чуть менее чем полностью.

Ответить
Развернуть ветку
muiren

Зато нет 3-х родов как в немецком (тут ещё надо помнить род существительных, чтобы употреблять правильный артикль der/die/das/ein/eine, ставить правильное окончание), в русском, нет падежей, которых в немецком – 4, в русском – 6, нет окончаний прилагательных как в немецком (где 3 типа склонения), в русском. Так что всё относительно, и конечно, зависит от родного языка изучающего. Потому что с родным русским языком несложно понять необходимость падежей и родов в немецком. А вот англоговорящий вряд ли такое поймёт.

Ответить
Развернуть ветку
C. Steel

А вот эсперанто легко изучить всем.

Ответить
Развернуть ветку
Andrey Babkin

Основная проблема английского - его совершенно убитая фонетика. Сказываются многочисленные завоевания острова, когда Британию захватывали то римляне, то викинги, то французы, то ещё черте знает кто. В итоге произношение слов в языке смешалось в одну кучу, и некоторые из них без транскрипции никогда не узнаешь, как должны произноситься на самом деле (поэтому, собственно, в словарях транскрипцию всегда и дают).
А вот грамматика в английском вполне себе топ, достаточно логичная.

Ответить
Развернуть ветку
muiren

Ну да, с фонетикой там не очень, но и у других популярных европейских языков фонетика так себе, и русский в их числе.

Ответить
Развернуть ветку
Denis Bystruev

Рассуждаете, как южный кореец.

У них все европейские языки, кроме английского, считаются «экзотическими».

Ответить
Развернуть ветку
Бомж

Лол у китайцев свой интернет. Если у испанцев есть возможность выбрать английский на веб страниче, то у китайского почти нет

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Бомж

Но всёранво на ютубе много сериалов и фильмов китайских с английскими субтитрами

Ответить
Развернуть ветку
Mikhail Che

круто, что русский второй самый используемый язык интернета
но в инфографике ошибка, русскоязычных в мире где-то 250-300 миллионов

Ответить
Развернуть ветку
Denis Bystruev

170 млн в инфографике — это те, как там написано, у кого русский язык первый.

250–300 млн всего — это, скорее всего, те, кто русский регулярно использует.

Но очень скоро меряться, какой язык больше распространён, будет не нужно.

С текущим прогрессом AI мы доживём до времени, когда практически всё, в том числе бытовой разговор, можно будет переводить «на лету» с пониманием контекста с качеством лучших синхронных переводчиков.

Ответить
Развернуть ветку
295 комментариев
Раскрывать всегда