Проблема заключается в том, что для голосового перевода необходимо получить приемлемое качество в режиме реального времени или хотя бы с минимальной задержкой. Если вы посмотрите на ту же Siri, она выводит на экран сказанные вами слова не сразу. То же самое будет происходить и с голосовым машинным переводчиком, появись он сегодня, что недостаточно быстро для реального общения.
Но это полбеды, ведь существует и проблема качества перевода. Мы готовы простить машинному переводчику какие-то погрешности в переводе текстов, когда смотрим на них в окне браузера, но если попробовать озвучить эти тексты без предварительной корректировки, мы рискуем получить на выходе прекрасно произнесенный, но не всегда понятный набор слов.
Ситуация усложняется и тем, что у разговорной речи есть своя специфика — мы говорим не совсем так, как пишем. Проблему можно было бы решить, если бы мы могли изначально построить машинный переводчик на основе аудиоданных. Но переведенных и озвученных параллельных текстов на разных языках банально меньше, чем переведенных и напечатанных, на которых строится текстовый машинный перевод. Так что качество такого переводчика было бы неудовлетворительным.
Поэтому сейчас мы вынуждены сначала распознавать сказанное, после преобразовывать это в текст, переводить на нужный язык и лишь потом озвучивать. Но есть и хорошие новости: все описанные проблемы вполне решаемы, поэтому в ближайшем будущем мы наверняка увидим долгожданный качественный голосовой перевод в режиме реального времени.
Антон, всегда интересовал вопрос - у кого все-таки качество перевода выше, и как оно измеряется? Очевидно, гугл получает намного больше пользовательского фидбека, чем яндекс - следует ли из этого, что перевод гугл транслейта лучше?
Надеюсь, корпоративная этика при ответе на мой вопрос будет отодвинута на второй план)
Влад, спасибо за вопрос!
Качество перевода измеряется с помощью сравнения переводов тестовых предложений (их обычно несколько тысяч), сделанных машиной, с эталонными, сделанными профессиональными переводчиками. При этом чаще всего используется автоматическая метрика BLEU (https://en.wikipedia.org/wiki/BLEU). Для более точной оценки иногда используют ручные метрики Adequacy & Fluency (clck.ru/BBWhi).
Что касается сравнения с Google Translate - тут всё зависит от направления перевода, о котором мы говорим: в каких-то направлениях мы оказываемся хуже, в каких-то лучше; к тому же, это достаточно быстро меняется со временем, так как над качеством постоянно ведётся работа и у Google, и у нас. Но могу сказать, что в целом для большинства направлений, включающих русский язык, большую часть времени мы впереди :)
А пользовательский фидбек хоть и помогает находить и решать локальные проблемы в переводе, но всё же главными факторами для построения качественного машинного переводчика являются скорее объёмы обучающих данных и алгоритмы обучения.
QA в Яндексе и QA в Гугле - это как взвод и армия.
Новые релизы гуглотранслейта реально намного лучше.
Отличная статья, не важно какой жопорукости у какого поисковика сейчас переводчик :) Все-равно прийдет тот день, когда мы будем запускать себе вавилонскую рыбку в ухо, как в у Дугласа Адамса в "Автостопом по галактике" и будем мгновенно понимать все языки вселенной ))))
Интересно, почему эсперанто не приживается? Может язык это не просто слова и грамматика, а нечто большее? Как будут переводить с "олбанского"?
Думаю, что машинный перевод будет развиваться, но сфера его использования будет ограничена. И поговорить "за жизнь" - это ведь не про погоду и детей спросить...