«Яндекс» обновил технологию машинного перевода в «Яндекс Переводчике» с помощью YandexGPT

Для перевода с английского на русский язык.

Нейросеть в «Переводчике» дообучили на эталонных текстах, подготовленных с помощью YandexGPT, сообщила компания. Благодаря этому сервис может точнее «понимать» контекст, распознавать фразеологизмы и ориентироваться в профессиональной лексике.
Обновлённая технология будет работать для перевода текстов с английского на русский — в «Переводчике», «Поиске» и для перевода видео в «Браузере».

По данным «Яндекса», сервис теперь «качественнее» справляется с длинными и сложными текстами — он лучше определяет взаимосвязь внутри предложений и между ними. А по контексту в статьях узконаправленной тематики «поймёт», что речь, например, идёт о языке программирования или фондовом индексе, и не станет переводить их названия.

«Переводчик» использует технологию машинного перевода на основе нейросетей с 2017 года. Нейросеть обучали только на парах текстов — оригинал и перевод на другой язык, чтобы она видела взаимосвязи и подражала им.
YandexGPT же умеет генерировать «сложные» и «разнообразные тексты», поэтому её использовали, чтобы создать примеры, на которых дообучили нейросеть в «Переводчике». Для генерации «Яндексу» пришлось разработать специализированную модель: та проанализировала тексты на русском и английском, изучив правила лексики, морфологии и синтаксиса, затем её настроили под задачи перевода, а после «ИИ-тренеры» оценивали его качество и ранжировали ответы от лучших к худшим.