«Яндекс» стал использовать в «Переводчике» нейросети для улучшения перевода

Сервис «Яндекс.Переводчик» стал использовать технологии нейронных сетей при переводе текстов, что позволяет повысить качество перевода, сообщили vc.ru в «Яндексе».

Сервис работает по гибридной системе, объясняли в «Яндексе»: к статистической модели, которая работает в «Переводчике» с момента запуска, была добавлена технология перевода с помощью нейросети.

«В отличие от статистического переводчика, нейронная сеть не разбивает тексты на отдельные слова и фразы. Она получает на вход предложение целиком и выдаёт его перевод», — объяснил представитель компании. По его словам, такой подход позволяет учесть контекст и лучше передать смысл переводимого текста.

Статистическая модель, в свою очередь, лучше справляется с редкими словами и фразами, подчеркнули в «Яндексе». «Если смысл предложения непонятен, она не фантазирует, как это может делать нейросеть», — отметили в компании.

При переводе сервис использует обе модели, затем алгоритм машинного обучения CatBoost сравнивает результаты и предлагает лучший, на его взгляд, вариант. «Гибридная система позволяет взять лучшее от каждого метода и повысить качество перевода», — говорят в «Яндексе».

В течение дня 14 сентября в веб-версии «Переводчика» должен появиться переключатель, с помощью которого можно будет сравнить переводы, выполненные гибридной и статистической моделями. При этом иногда сервис может не изменять тексты, отметили в компании: «Это значит, что гибридная модель решила, что статистический перевод лучше».

Оригинал: Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai «Ngaje Ngai», the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.

Статистический перевод: Килиманджаро — это заснеженные горы 19,710 футов в высоту, и считается самой высокой горой в Африке. Его Западной вершины называется Масаи «Ngaje Нгаи», дом Божий. Недалеко от западной вершины есть сушеная и замороженная туша леопарда. Никто не объяснил, что леопард искал на такой высоте.

Перевод, выполненный гибридной моделью: Килиманджаро является заснеженной горой 19 710 футов высотой, и, как говорят, самая высокая гора в Африке. Ее западная вершина называется по-масайски «Нгайэ Нгайя», Дом Бога. Рядом с западной вершиной находится сушеная и замороженная туша леопарда. Никто не объяснил, что леопард искал на такой высоте.

Литературный перевод: Килиманджаро — покрытый вечными снегами горный массив высотой в 19710 футов, как говорят, высшая точка Африки. Племя масаи называет его западный пик «Нгайэ-Нгайя», что значит «Дом бога». Почти у самой вершины западного пика лежит иссохший мерзлый труп леопарда. Что понадобилось леопарду на такой высоте, никто объяснить не может.

сравнение переводов по статистической и гибридной модели

На первом этапе гибридная система будет работать только для переводов с английского на русский — это самое популярное направление перевода, на него приходится около 80% запросов, говорят в «Яндексе». Добавить другие языковые пары компания планирует в ближайшие несколько месяцев, но точные сроки и языки не называет.

Оригинал: Over the past few years, it has become conventional wisdom that dramatic advances in robotics and artificial intelligence have put us on the path to a jobless future. We are living in the midst of a «second machine age», to quote the title of the influential book by MIT researchers Erik Brynjolfsson and Andrew McAfee, in which routine work of all kinds — in manufacturing, sales, bookkeeping, food prep — is being automated at a steady clip, and even complex analytical jobs will be superseded before long. A widely cited 2013 study by researchers at the University of Oxford, for instance, found that nearly half of all jobs in the US were at risk of being fully automated over the next 20 years. The endgame, we’re told, is inevitable: The robots are on the march, and human labor is in retreat.

Статистический перевод: За последние несколько лет, она стала расхожее мнение, что драматические достижения в области робототехники и искусственного интеллекта поставит нас на путь к безработице будущем. Мы живем в разгар «второй век машин», если процитировать название влиятельной книгой по mit исследователи Эрик Бринолфссон и Эндрю Макафи, в каком распорядке работы всех видов — в производство, продажи, Бухгалтерия, готовка еды — автоматизируется темпами, и даже сложные аналитические задачи будут заменены в скором времени. Широко цитируемое исследование 2013 году исследователи из Оксфордского университета, например, показало, что почти половина всех рабочих мест в США были в опасности быть полностью автоматизирован в течение ближайших 20 лет. Эндшпиль, как нам сказали, это неизбежно: роботы на марше, а труд человека при отступлении.

Перевод, выполненный гибридной моделью: За последние несколько лет, это стало обычной мудростью, что драматические достижения в робототехнике и искусственном интеллекте поставили нас на путь к безработному будущему. Мы живем в разгар «второй век машин», если процитировать название влиятельной книгой по mit исследователи Эрик Бринолфссон и Эндрю Макафи, в каком распорядке работы всех видов — в производство, продажи, Бухгалтерия, готовка еды — автоматизируется темпами, и даже сложные аналитические задачи будут заменены в скором времени. Широко цитируемое исследование 2013 года исследователями Оксфордского университета, например, показало, что почти половина всех рабочих мест в США рискуют быть полностью автоматизированными в течение следующих 20 лет. Эндшпиль, как нам говорят, неизбежен: роботы вышли на марш, человеческий труд отступает.​

Оригинал: Apple announced the latest iPhone yesterday. It’s thinner, faster and has a better screen than the previous model. But of course it does. That’s how these things go. But the phone also lacks things I consider part of my daily life. I’m lost. This iPhone is not for me.​

Статистический перевод: Вчера компания Apple анонсировала новый iPhone. Это тоньше, быстрее и лучше экрана, чем у предыдущей модели. Но, конечно, это делает. Вот как эти вещи идут. Но телефон также не хватает вещей, которые я считаю частью моей повседневной жизни. Я потерян. Это iPhone-это не для меня.

Перевод, выполненный гибридной моделью: Вчера компания Apple анонсировала новый iPhone. Это тоньше, быстрее и имеет лучший экран, чем предыдущая модель. Но, конечно, есть. Вот как все это происходит. Но телефон также не хватает вещей, которые я считаю частью моей повседневной жизни. Я потеряна. Этот iPhone не для меня.

Google использует нейросети для повышения качества перевода в сервисе «Google Переводчик» с 2016 года. Весной 2017 года компания внедрила технологии машинного обучения для улучшения перевода русского языка.

22
6 комментариев

Заметно, что нейронки куда лучше согласуют слова в предложении, но смысл не улавливают ни старые алгоритмы, ни новые. Поэтому честно говорить: был статистический перевод, основанный на правилах, стал статистический, основанный на нейронных моделях. Разница лишь в том, что правил больше и нейронка конструирует их сама.

Яндексу лучи поддержки — здорово, что поспеваете за Корпорацией Добра.

10

Комментарий удалён модератором

Теперь надо проверить все это классическим методом: переводом "туда-обратно":))

1

Лучше бы добавили возможность выбирать вариант перевода, который будет отображаться в закладках