«Яндекс» обновил технологию машинного перевода в «Яндекс Переводчике» с помощью YandexGPT

Для перевода с английского на русский язык.

  • Нейросеть в «Переводчике» дообучили на эталонных текстах, подготовленных с помощью YandexGPT, сообщила компания. Благодаря этому сервис может точнее «понимать» контекст, распознавать фразеологизмы и ориентироваться в профессиональной лексике.
  • Обновлённая технология будет работать для перевода текстов с английского на русский — в «Переводчике», «Поиске» и для перевода видео в «Браузере».
Источник: «Яндекс»
Источник: «Яндекс»
  • По данным «Яндекса», сервис теперь «качественнее» справляется с длинными и сложными текстами — он лучше определяет взаимосвязь внутри предложений и между ними. А по контексту в статьях узконаправленной тематики «поймёт», что речь, например, идёт о языке программирования или фондовом индексе, и не станет переводить их названия.
Источник: «Яндекс»
Источник: «Яндекс»
Источник: «Яндекс»
Источник: «Яндекс»
  • «Переводчик» использует технологию машинного перевода на основе нейросетей с 2017 года. Нейросеть обучали только на парах текстов — оригинал и перевод на другой язык, чтобы она видела взаимосвязи и подражала им.
  • YandexGPT же умеет генерировать «сложные» и «разнообразные тексты», поэтому её использовали, чтобы создать примеры, на которых дообучили нейросеть в «Переводчике». Для генерации «Яндексу» пришлось разработать специализированную модель: та проанализировала тексты на русском и английском, изучив правила лексики, морфологии и синтаксиса, затем её настроили под задачи перевода, а после «ИИ-тренеры» оценивали его качество и ранжировали ответы от лучших к худшим.
2323
11
51 комментарий

Хорошее дело. Интересно будет посравнивать с Deepl и Гугл Переводчиком

3
Ответить

Например, возьмем нетривиальную цитату Конан Дойла из Шерлока Холмса:

It is a capital mistake to theorize before one has data. Insensibly one begins to twist facts to suit theories, instead of theories to suit facts

Все три переводят неплохо, но первое место я бы отдал Deepl, второе Яндексу, а третье - Гуглу из-за "в соответствии с теориями вместо теорий"

Deepl:

Теоретизировать, не имея данных, - большая ошибка. Невольно начинаешь переиначивать факты в соответствии с теориями, а не теории в соответствии с фактами.

Yandex:

Строить теории, не располагая данными, - большая ошибка. Постепенно человек начинает искажать факты в угоду теориям, а не теории в угоду фактам

Google:

Теоретизировать, не имея данных, — серьёзная ошибка. Незаметно человек начинает искажать факты в соответствии с теориями вместо теорий в соответствии с фактами.

15
Ответить

Ну нет, что-то не то. DeepL все еще прекраснее всех на свете. ;)

7
Ответить

В Xтвиттере есть тред, где просят рассказать факт о прошлой работе, о котором нельзя было говорить пока ты там работал.
Оказалось что ИИ распознаватель счетов в Intuit Quickbooks были живые ребята с Филиппин на самом деле.

Не удивлюсь, если говно-яндекс прикрутил DEEPL по API и обязательно добавил любимой цензурки в такие переводы

4
Ответить

Нее, у Яндекса перевод на совпадает в Deepl, только что проверил

6
Ответить

К сожалению сейчас технологии Яндекса в сфере ИИ не дотягивают до ихних. Я месяц всяко крутил Алису Про, ЯндексГПТ - полное гавно. Курит по сравнению с ОпенАИ, ноушеном и тд. Чуть что-сливается или предлагает поискать в яндексе :)) изменение промпта не помогает. Добавление в промпт (степ-бай-степ и это важно для моей карьеры) никак не улучшает выдачу.

Ответить

Хорошее дело. С такими темпами такая профессия как переводчик особо и не понадобится. Их место займёт нейросеть.

4
Ответить