{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Мы сделали закадровый перевод на английский русскоязычных видео

Летом 2021г. Яндекс запустил технологию машинного перевода видео. Технология позволяет смотреть англоязычные ролики с русской озвучкой.

Это же круто! подумали мы, и хотели бежать смотреть англоязычные ролики в русском переводе. Но оказалось, что без установленного браузера от Яндекс, это сделать не получится.

Тогда же пришла идея, сделать свою технологию закадрового перевода русскоязычных роликов на английский. В таком случае любой видео блогер сможет быстро и легко адаптировать свой русскоязычный контент для англоязычной аудитории без лишних усилий, увеличить количество подписчиков, охват и монетизацию. Более того, мы убеждены, что большое количество русскоязычного контента было бы реально интересно англоязычной аудитории, если бы не языковой барьер!

Подумали — сделали!

Привет, меня зовут Станислав, вместе с моим партнером Николаем мы разрабатываем сервис для закадрового перевода видео — @VideoVoicecoverBot.

MVP пока доступен в виде Telegram бота и совершенно бесплатно :). В дальнейшем мы планируем сделать веб сервис. Если захотите обсудить, мы открыты для обсуждения идей и предложений — @uberwow.

Примеры:

English -> Русский

Русский -> English:

Оригинал: https://youtu.be/tz1XUyGP8gQ

(в одном из переведенных примеров есть забавный артефакт :), самым наблюдательным просьба написать его в комментарии — подарим инвайт с предоплаченными минутами на перевод после запуска сервиса).

Технические нюансы:

Перевод, который выполняет Voicecover, получается закадровым и двухголосым. Мужские голоса переводятся мужским голосом, женские — женским. Оригинальная звуковая дорожка приглушается так, чтобы она была слышна, но не мешала восприятию, и накладывается на переведенную.

Бот умеет переводить закадровую речь в двух направлениях: с русского на английский и с английского на русский. Технически это выглядит как набор обработчиков и нейронных сетей, каждая из которых выполняет свою функцию.

Первым делом мы извлекаем с видео аудиодорожку и применяем к ней Speech Enhancement для удаления шумов и VAD (Voice activity detector) для определения начала и конца отрезков фраз. Далее мы распознаем и извлекаем текст с помощью VOSK, восстанавливаем знаки пунктуации, определяем границы предложений и привязываем к временным меткам информацию о поле говорящего, скорости, интонации и ударениях.

Переводим текст, и синтезируем в речь на выбранном языке с учетом пола, интонации, скорости и ударений. Отдельная нейросеть отвечает за синхронизацию оригинальной и переведенной речи, чтобы она выглядела органично. За синтез отвечает модель перевода текста в речь Rhasspy Larynx.

Что дальше?

Текущая реализация является далеко не идеальной, есть возможности для улучшения качества распознавания речи, перевода и синтеза, чем мы обязательно займемся.

В планах так же добавить клонирование голоса оригинального спикера и транслировать его на синтезированный перевод, субтитры и другие крутые фичи. Стоит отметить тот факт, что на всех этапах обработки, мы не используем сторонних сервисов. Весь процесс происходит на нашем сервере локально.

Концептуально веб сервис будет выглядеть так:

Процесс использовнания сервиса выглядит крайне простым: выбираете желаемую громкость оригинальной звуковой дорожки, направление перевода и добавив ссылку на видео в Youtube или загрузив в виде файла, и нажимаете Перевести.

Результатом работы будет переведенный видео ролик, а также переведенное название и описание. Вам остаётся только скачать и залить видео на ваш канал.

Когда ждать релиза?

На самом деле мы будем очень признательны за ваш фидбек. Если это кому-то интересно и нужно, мы сделаем всё возможное, чтобы максимально быстро запустить сервис в работу.

Всем спасибо за внимание: )

0
17 комментариев
Написать комментарий...
PCT URL

Переводчики в итоге выйдут из чата раньше программистов, таксистов, и даже грузчиков, да? 🤔

Ответить
Развернуть ветку
Станислав
Автор

На самом деле не думаю, что прямо так категорично. Как минимум многим при личном общении важен перевод физического переводчика. Как максимум, в скором временим появится рынок разметки данных для создания датасетов для обучения сеток на разные языковые пары, где переводчики смогут принимать самое активное участие.

Ответить
Развернуть ветку
Rnatery

да

Ответить
Развернуть ветку
Павел Борисов

Капец вы красавчики! Я только подумал том что может быть такой бот, забил в гугле и вы опубликовали статью 40 минут назад. Супер совпадение)

Ответить
Развернуть ветку
Станислав
Автор

Спасибо) Как говорит один известный оратор: Совпадение? Не думаю!

Ответить
Развернуть ветку
Сергей Плахин

Это ваша технология или вы просто используете api яндекса подобных платформ для синтеза/перевода?

Ответить
Развернуть ветку
Станислав
Автор

Добрый день! Да, как я и писал в статье, все технологии (распознавание, перевод, синтез) работают локально на нашем сервере, без доступа к внешним провайдерам.

Ответить
Развернуть ветку
Konstantin Gavrilenko

Очень интересно! Заявку в боте вам отправить???

Ответить
Развернуть ветку
Станислав
Автор

Добрый день, взаимодействие с ботом крайне простое:
1. Запускаем бота у себя в телеграме
2. Выбираем в меню направление перевода
3. Скидываем боту в чат ссылку на видео
4. Ждем окончания процесса перевода
5. Скачиваем результат )

Ответить
Развернуть ветку
С Ром

Ну надо же.. Технологии начинают уравнивать технологические компании и стартапы.. под капотом ведь целый комбайн из технологий 🤪👍 круто, молодцы ребята.

Ответить
Развернуть ветку
Максим Гридин

Так амбициозно всё звучало...
Выглядело очень перспективным и востребованным.
Бот мёртв, хотя и не удалён.
Проект в 2023-м сдулся??

Ответить
Развернуть ветку
Serhii Kulbashnyi

маладцы!!

Ответить
Развернуть ветку
Dmitry Nechayev

Бот завис. Есть опции связаться с вами? В боте контактов нет

Ответить
Развернуть ветку
Ксения Кукушкина

Бот не работает((
Информацию о сервисе не смогла найти в гугл

Ответить
Развернуть ветку
Rnatery

просто скачай яндекс браузер

Ответить
Развернуть ветку
Андрей Игошин

вот еще бы майле облаке сделали перевод при просмотре цены бы вам не было

Ответить
Развернуть ветку
Виктор Г.

Видео в облаке недоступно

Ответить
Развернуть ветку
14 комментариев
Раскрывать всегда