Как работать с восточными языками в App Store и Google Play

Меня зовут Никита Лобанов, ASO Expert ASOdesk. В этой статье я расскажу об особенностях работы со сбором семантического ядра и составлением метаданных на восточных языках: арабском, японском и тайском.

Как работать с восточными языками в App Store и Google Play

Помимо базового сбора семантического ядра, важно работать с различными словоформами в языках. Чем больше мы наберём релевантной семантики различного рода, чем больше будет частотных ключевых слов, тем больше будет простора для маневра. Мы сможем охватить больше пользователей и получить преимущество перед конкурентами. И чем более специфичными будут наши слова в некоторых локализациях, особенно восточных, тем больше возможности найти лазейку, чтобы на новом рынке получить свою долю трафика.

Это серия статей, основанных на материалах лекций ASOdesk Академии, где мы затронули все аспекты поисковой оптимизации приложений. Мы уже рассказывали, с чего начать работу над ASO, публиковали чек-лист по работе с Google Play, объясняли, что влияет на позиции в магазинах приложений и делились лайфхаками по ASO.

Этот материал — на стыке ASO и языкознания. Мы рассмотрим особенности восточных языков и углубимся в широкое исследование семантики. Поговорим про три языка: арабский, японский и тайский. Всё это восточные языки, но они немного отличаются друг от друга.

Арабский язык

Использование артиклей

В арабском языке нет неопределенного артикля. Его функции выполняют другие части речи. Однако, есть определенный артикль. Он представляет собой безударную частицу ال‘ (ал-), которая ставится перед словом и пишется слитно с ним. Все мы слышали эту приставку из школьной программы. Например, слово «алгебра» — пример использования определённого артикля. При сборе семантики необходимо учитывать обе версии конкретного ключевого слова: с артиклем и без. Иначе мы теряем трафик. Ниже я привожу пример того, как пишется слово «солнце» с артиклем и без.

Примеры:

شمس — солнце

الشمس — (это) солнце

Ещё один пример — слово «здоровье».

Поисковая выдача по слову «здоровье» с артиклем и без на арабском
Поисковая выдача по слову «здоровье» с артиклем и без на арабском

Слева слово без артикля, и его traffic score — 3455 + брендовые запросы. Справа мы видим употребление слова с артиклем. Да, здесь traffic score меньше, но количество предложенных поисковых запросов больше. Зачастую, чем длиннее и больше запрос и ниже его частотность, тем он менее конкурентный. То есть мы можем ориентироваться на слово «здоровье» с артиклем, но работать с огромным количеством дополнительных слов и продвигаться по ним.

Если мы не будем учитывать в поиске одно из этих слов, то можем потерять дополнительный трафик. Вероятность, что по слову с артиклем вы продвинетесь выше, большая, потому что оно менее конкурентное.

Огласовки

Арабская клавиатура. Красным цветом выделены огласовки
Арабская клавиатура. Красным цветом выделены огласовки

В арабском языке мало гласных и большинство букв — согласные. У букв огромное число вариаций их написания. Огласовки — это надстрочные и подстрочные диакритические знаки, которые используются для обозначения кратких гласных звуков и других особенностей произношения слова, не отображаемых буквами (на примере выделены красным цветом). Они не пишутся, но произносятся. Могут писаться в священных текстах, азбуке, букваре, словаре для людей, которые начинают изучать язык. Обычно в письме они только подразумеваются.

Поисковая выдача по бренду Azar c огласовкой и без
Поисковая выдача по бренду Azar c огласовкой и без

Это брендовое название приложения Azar. В поиске мы видим примеры с огласовками. Слева мы видим запрос с огласовкой и всего один пример. Справа видим запросы без огласовок. Огласовки не принесут много трафика, но стоит обращать на них внимание, чтобы найти свою лазейку для получения более высоких позиций.

Учитывайте, что арабский язык читается справа налево, и у каждого из трех приведенных слов мы видим на конце что-то вроде перевернутой кириллической буквы Р. Есть два варианта написания этого окончания: с двумя точками и без них. Это обозначение письменного и разговорного языка. Здесь мы видим своеобразную картину: очень много семантики и в одном написании, и в другом.

Поисковая выдача по слову «чат» на арабском
Поисковая выдача по слову «чат» на арабском

Арабы любят транслитерировать слова в огромном количестве вариаций. Например, слово «чат» имеет 3-4 варианта написания, абсолютно непохожих друг на друга. Большинство из них — транслитерация, это нужно учитывать. То есть когда вы собираете семантику и используете встроенный переводчик в сервисе, вы увидите очень много разных слов, которые переводятся одинаково. Не бойтесь этого, особенно если это такие слова, как «чат», которые вряд ли существовали в арабском языке. Вы можете использовать все варианты, причем в зависимости от ваших позиций, можете ставить одну вариацию написания в заголовке, вторую в подзаголовке и еще несколько использовать в ключевых словах. Вы охватите ключевое слово со всех сторон и сможете выбирать варианты, по которым лучше показатели.

Пунктуация

В современном арабском литературном языке используются европейские знаки препинания, но с некоторыми изменениями, вызванными иным направлением письма — справа налево. Вы можете проставлять с европейской клавиатуры знаки, они будут адаптироваться и не будут вам мешать индексироваться так, как нужно.

Как работать с восточными языками в App Store и Google Play

Арабский язык состоит из букв. Мы работаем с ним технически так же, как с европейскими языками. То есть вы видите слово, вы фильтруете по нему список запросов и можете их спокойно добавлять через запятую в заголовок, подзаголовок, поле для ключевиков и так далее. Главное — фиксировать словоформы.

Лайфхаки

Допустим, нам нужно на незнакомом языке прописать какие-нибудь ключевые слова в заголовке, чтобы они при этом не настораживали носителей. Вы можете воспользоваться переводчиком в ASOdesk. Он хорошо переводит все существительные. Учитывайте, что существительные в арабских словосочетаниях всегда пишутся первыми. То есть то первое слово, которое вы видите в словосочетании в любом запросе — это, скорее всего, существительное. Если мы пишем на своем языке «дешевые билеты», то арабы будут писать «билеты дешевые».

Примеры ключей:

1) أكشن — action

2) ألعاب — game

Если в заголовке нужно связать два существительных, используйте союз «و». Таким образом, мы можем написать «action and game».

Технически арабский ничем не отличается от европейских языков. Есть слова, пробелы, союзы. Если вы работаете в Google Docs, можете написать название своего приложения слева и поставить двоеточие. В магазине приложений всё будет правильно отображаться.

Пример названия:

ألعاب و أكشن: YourApp

Чтобы сэкономить время, можно также отдать перевод описания, текстов на скриншотах можно переводчикам-носителям в сервисе профессионального перевода Nitro. Сервис включает больше 60 языков, включая восточные.

Японский язык

Виды японского письма

В японском языке, в отличие от арабского, всё немного сложнее. Эта культура от нас ещё более далекая. В силу того, как развивалась Япония, и её исторических особенностей, там есть три системы написания: Кандзи, Хирагана и Катакана. Все эти три системы встречаются при сборе семантики. Нужно это учитывать, чтобы корректно составлять метаданные.

Примеры написания местоимения «я» в трех системах:

Кандзи — 私

Хирагана — わたし

Катакана — ワタシ

Поиск семантики

Японский язык не предполагает широкое использование пробелов, однако такие запросы встречаются довольно часто, что позволяет нам разбивать один большой ключ на несколько составных частей, и это дает нам возможность расширить область поиска семантики.

Японцы иногда ставят пробелы в поиске. Естественно, там, где вы видите пробел, смело разбиваете запросы на части.

Пример разбивки запроса на составные части <a href="https://api.vc.ru/v2.8/redirect?to=http%3A%2F%2Fasodesk.com&postId=138657" rel="nofollow noreferrer noopener" target="_blank">ASOdesk</a>
Пример разбивки запроса на составные части ASOdesk

На скриншоте вы видите большую фразу. Здесь как минимум три слова, и мы видим все производные от них, то есть сразу несколько слов. Мы видим частотность и можем копать в глубину по каждому из слов. Также собираем запросы по фразам, где нет пробелов.

Составление метаданных

Плюс японского языка в том, что он краткий, в отличие и от арабских и европейских языков. Один иероглиф может значить многое. 100 знаков в поле ключевых слов позволяют использовать множество поисковых запросов. Вы можете вставлять запросы на всех трех видах написания, следить и оценивать динамику продвижения по этим запросам.

При составлении заголовков и подзаголовков следует учитывать, в какой конкретной версии написания будут выдержаны эти поля. В противном случае это может негативно повлиять на визуальное восприятие.

По этой же причине не следует добавлять в видимые поля слова через запятую. Лучше использовать грамматически корректно составленное полное название приложения без пробелов.

Есть несколько гипотез о том, как ранжируются азиатские языки. Моя практика показывает, что большая фраза может попадать в индексацию только одна, а все входящие в нее запросы, если они прописаны не через пробел, скорее всего, не будут индексироваться. Но это стоит проверять и тестировать на своём приложении, так как не всегда работает тот или иной механизм.

Более подробно по ASO на японском рынке писала Adzsa Hatano из Phiture. О том, как продвигать приложения в Японии, Корее и Китае, также есть хорошая статья у Alconost.

Тайский язык

Особенности написания

Тайские слова в предложении не разделяются пробелами: целые фразы или предложения обычно пишутся вместе.

Пример тайского письма:

ภาษาไทยทาใหคนรสกถงความเปนเจาของ

สอสารทดตอกน

Огромное предложение — это просто сочетание большого количества иероглифов без пробелов. Разобраться в этом с первого раза тяжело. С другой стороны, это тоже дает своего рода преимущество. Ниже я расскажу какое.

Сбор семантики и индексация

Механика сбора семантики на тайском языке похожа на японский, но здесь советую больше обращать внимание на среднечастотные и низкочастотные запросы, которые физически больше.

Пример разбивки низкочастотного запроса на составные части <a href="https://api.vc.ru/v2.8/redirect?to=http%3A%2F%2Fasodesk.com&postId=138657" rel="nofollow noreferrer noopener" target="_blank">ASOdesk</a>
Пример разбивки низкочастотного запроса на составные части ASOdesk

На изображении вторая фраза «applications for partners» — это самый большой ключ, который у нас есть в данной сборке. Этот запрос включает в себя все перечисленные выше и ниже. Все слова зачастую состоят из трех знаков. Таким образом, вы можете пробовать делить слова на три знака. Мы делим, получаем больше запросов и начинаем искать по всем ним семантику.

Особенности написания

И в азиатских, и в европейских языках очень важна словоформа. Мы не вставляем фразу через пробел, а пишем через запятую. В тайском языке всё работает иначе.

Берём базовый запрос с прошлого скриншота, разбиваем его на три слова, на выходе получаем три запроса. Но мы используем этот ключ без пробелов и добавляем его в любой заголовок или индексируемое поле, так получаем выдачу по всем трем ключевым словам. Здесь эффективно использовать как можно больше больших фраз. Естественно, их нужно проверять на наличие в них наших целевых ключей. Но имейте в виду, что одно предложение индексируется как куча разных слов без использования запятых.

Базовый запрос: แอพหาคนอน

Разбивка: แอพ_หาค_นอน

Ключи на выходе:

1. แอพ;

2. หาค;

3. นอน.

Пример:

YourApp: แอพหาคนอน

Важно: использование наиболее длинного запроса позволит получить индексацию по всем словам, входящим в словосочетание отдельно.

Восточные локализации очень часто более просты для продвижения, чем все остальные. Гораздо проще продвигаться в Саудовской Аравии, чем в Канаде или в США. И продвижение на Восток — это еще одна возможность быстро получить трафик. Потребуется лишь несколько итераций и немного усилий. Главное — собрать как можно больше семантики.

2020
3 комментария

Про тайский язык вы написали полную чушь. Не учите тому в чем вообще ничего не понимаете.

Ответить

Подскажите, в чем мы ошиблись? Спасибо

Ответить