Перевод контента сайта на много языков — как делать корректно

Поисковые сервисы позволяют нам не только быстро находить нужную информацию, но и стараются по возможности угадать, что именно мы хотели бы увидеть. Такой подход работает не всегда, так как пользователи могут не соглашаться с тем, как тот или иной поисковик трактует их запрос. С другой стороны, комбинация предиктивных функций и машинного обучения позволяет нам довольно часто находить больше информации, при этом делаю сам процесс лучше и быстрее.

Вы скорее всего замечали, что иногда в поиске могут отображаться релевантные ссылки не на том языке, на котором вы сделали запрос. Это происходит потому что Google, как и некоторые другие поисковые сервисы, достаточно внимательно относится к локальному ранжированию. Например, при отправке запроса о покупке кофе или наполнителя для кошачьего лотка, вы не увидите в поисковой выдаче множество интернет-магазинов с международной доставкой.

Скорее всего, результаты будет составлять выборка из ведущих онлайн площадок для вашего региона или города, дополненная локальными результатами с контактной информацией ближайших точек продаж. В то же время, если вы будете искать информацию о рационе для котов или оптимальном помоле кофе, то в зависимости от комбинации факторов, результаты поиска могут включать страницы на нескольких языках.

Это происходит потому, что система распознала локальный транзакционный запрос в одном случае и информационный - в другом. Соответственно, ранжирование проходит по-разному в каждом из случаев.

Локальные результаты и языковые особенности

Как известно, при обработке любого поискового запроса, Google берет во внимание огромное количество факторов. Для целей нашего примера стоит отметить вашу индивидуальную историю поисков на конкретном аккаунте, устройстве, а также ваши настройки геолокации, языка и региона.

Почему это важно?

Дело в том, что отображая результаты информационного запроса, Google может включить информацию на испанском, если будут причины предполагать, что вы этот язык знаете.

Такую информацию можно взять из вашей истории поиска. То есть, если вы недавно посещали сайты на иностранном языке, либо делали поисковые запросы на нем, то с большой долей вероятности можно предположить, что вам могут быть полезны результаты не только на русском, но и на испанском. Тем не менее, такая ситуация намного более вероятна для Западных пользователей.

Дело в том, что неправильно будет утверждать, что у поисковой выдачи есть приоритетный и второстепенный языки, каждый из которых получает свою квоту результатов.

Определяющую роль играют ранжирование, авторитет страницы и релевантность поисковому запросу. То есть, если вы находитесь в США, но вводите в строку поиска “кофе”, то первым результатом будет русскоязычная страница википедии, а вторым — та же страница, но на английском. Так происходит потому, что эти две страницы имеют наивысший авторитет и соответствие этому очень обобщенному запросу. Первая — так как она максимально подходит тому, что вы ввели, а вторая — потому что Google также рассматривает перевод поискового запроса на наиболее популярные языки в том регионе, где вы находитесь.

Перевод контента сайта на много языков — как делать корректно

Чтобы проверить правильность нашего подхода, предположим, что вы находитесь в Испании. Если вы введете запрос “кофе”, то практически вся поисковая выдача также будет на русском. В то же время, если вы поменяете исходный запрос на “coffee” то уже третий органический результат будет полностью на испанском.

Перевод контента сайта на много языков — как делать корректно

Таким образом, при оценке контента на нескольких языках, важно не только учитывать внутренние факторы каждого пользователя — историю поиска и прочие сигналы, которые могут указать на владение иностранным языком. Важно помнить о локальных особенностях самого региона, так как Google будет брать во внимание на каких языках разговаривают в той местности, откуда пользователь делает запрос. Это настолько важно, что используется любой доступный индикатор — при отключенной геолокации, язык браузера или операционной системы и так далее.

Перевод сайта - доступно и понятно

Один важный момент, который нужно упомянуть сразу: есть большая разница между локализацией и переводом и не важно, идет ли речь о сайте, веб-приложении или еще чем-то.

Перевод — это попытка максимально точно перенести предложение или мысль на другой язык. Если очень сильно обобщить, то есть два основных подхода к переводу как таковому:

  • буквальный
  • трансформационный.

В зависимости от того, что именно вам нужно, буквальный перевод означает подбор максимально похожего аналога. При этом часто теряется часть смысла, зато предложения имеют минимальные отличия в структуре и длине.

Трансформационный подход — это в первую очередь передача мысли и сути предложения, а его структура при этом может практически игнорироваться.

Например, шутку или анекдот практически невозможно перевести буквально. Буквальный перевод позволит вашим слушателям понять смысл сказанного, но смешно им не будет. А трансформационный перевод — зачастую единственный шанс хотя бы на вынужденную улыбку.

Локализация — намного более широкое понятие в интересующем нас контексте. При локализации происходит перевод, но с учетом целого ряда дополнительных факторов. Задача локализации — вызвать те же эмоции и передать те же мысли для людей из совершенно другой культуры. То есть мы переводим сайт на испанский, но локализацию мы делаем для Испании. Рискуя запутать вас еще больше, скажем, что в этом примере мы также можем сделать локальную версию для Мадрида или Барселоны.

Что нужно учитывать при локализации:

  • Культура — от сленга и разговорных выражений, до особенностей восприятия, опечаток и прочего.
  • Законы — очень важно знать нормы и законы страны или региона, так как некоторые темы могут иметь свои особенности, ограничения и даже запреты. В некоторых случаях, вы можете нести юридические обязательства о которых даже не догадывались.
  • Обычаи — то, как выглядят и подают схожий контент локальные сайты. Исследование рынка еще никому не мешало, а использование существующих на рынке практик только увеличит ваши шансы на успех.

Не секрет, что с задачами перевода текстов все лучше справляются алгоритмы, потому есть еще один аспект того, как именно вы будете подходить к такому проекту.

Автоматический или машинный перевод — это крайне удобно, быстро и, в некоторых случаях, достаточно качественно. Потому многие сайты активно пользуются разнообразными плагинами, виджетами и сервисами, позволяющими отображать их содержимое на любом поддерживаемом языке за считанные секунды.

Основная проблема здесь заключается в том, что алгоритмы или, в лучше случае, обучаемые нейронные сети, которые и отвечают за конечный результат, ограничены в своих возможностях. Чаще всего самые большие проблемы возникают с самыми короткими предложениями. Например, перевод фразы “я хочу пить” в первую очередь передает мысль о том, что меня мучает жажда.

Перевод контента сайта на много языков — как делать корректно

В то же для фразы “я хочу выпить” приоритетным становится само действие, в то время как смысл в значительной части теряется.

Перевод контента сайта на много языков — как делать корректно

Добавив немного контекста, мы получим одинаковый результат в обоих случаях, что хорошо показывает как даже наличие дополнительного контекста может искажать результаты.

Перевод контента сайта на много языков — как делать корректно
Перевод контента сайта на много языков — как делать корректно

Потому, машинный перевод может подойти в тех случаях, когда техника и скорость важнее качества. Также не забывайте, что в случае с нейронными сетями, пользователи могут повлиять на результаты обучения. Потому, если кто-то захочет пошутить при помощи уязвимости в алгоритме, ваша репутация может стать невольным заложником ситуации.

Что касается ручного перевода, то для ускорения и удешевления услуг, многие агентства предлагают вычитку и редактирование результатов машинного перевода. Тем не менее, для самых лучших результатов, стоит пользоваться услугами квалифицированных специалистов из плоти и крови как можно чаще.

Представитель Google многократно обращали наше внимание на то, что стилистика текста имеет огромное значение при ранжировании. Потому можно смело предполагать, что алгоритмы Google не будут давать одинаковый приоритет текстам переведенным или написанным роботами и живыми людьми.

Техническая сторона перевода

Учитывая, что поисковой сервис способен анализировать и сравнивать содержимое страниц на разных языках, возникает вопрос о дублировании контента. То есть, каким образом можно обезопасить свой сайт от того, чтобы многоязыковые страницы не получили санкции как дубликаты?

Чтобы узнать больше о практической стороне вопроса, рекомендуем обратить внимание на доклад Андрея Новоселова, который прозвучит на 18 онлайн-конференции по продвижению на западных рынках NaZapad. Подобные мероприятия отличный источник ценной информации, так как участники делятся реальными кейсами из своего опыта.

Для этой задачи существует тег hreflang и кластеризация языковых версий. В общем случае, тег hreflang содержит два основных параметра: язык и регион к которым относится та или иная страница. То есть когда в ответ на ваши поисковые запросы вы видите локализованные версии сайтов в результатах — это, скорее всего, результат соответствующих настроек hreflang.

Также важно отметить, что не все поисковые сервисы придают одинаковое значение данному тегу при определении подходящей локализованной версии страницы. Например, Bing и Baidu предпочитают использовать атрибут lang в составе тега. Тем не менее такие гиганты как Google и Yandex все же отдают предпочтение hreflang.

Еще одна важная особенность языковых версий одной страницы это то, что они не считаются дубликатами. Все версии согласно hreflang объединяются в соответствующие языковые кластеры. Примечательно то, что сигналы от каждой отдельной страницы влияют на кластер в целом. И потому высокая релевантность одной языковой версии может поднять результаты ранжирования для всех остальных.

Для того чтобы ознакомиться с данной темой подробнее, рекомендуем два наиболее полезных на наш взгляд видео об hrefland от Google:

Есть несколько важных правил, чтобы обеспечить оптимальную эффективность работы ваших тегов hreflang:

  • Преемственность — не забывайте добавлять информацию о всех языковых версиях на все страницы, а не просто уводить локальный трафик с основной страницы на переведенную версию.
  • Самоопределение — помимо перечисления версий страницы на других языках или для разных регионов, важно также добавить в список соответствующие параметры для той страницы, на которой вы уже находитесь. То есть, при добавлении переведенных версий страницы на русском, на саму страницу-оригинал также нужно добавить тег hreflang с указанием ее как основной для русского языка.
  • Абсолютные адреса — для всех ссылок необходимо указывать абсолютные адреса, включая протокол передачи данных (http или https).
  • Децентрализация — локальные версии страницы не обязательно должны находиться на том же домене, что и основная версия.

Более подробно о правилах реализации hreflang тегов можно прочитать в этом руководстве от Google.

66
Начать дискуссию