Эксперимент: как русскоязычному пользователю научиться создавать популярные тексты на английском языке

Разбор основных ошибок, с которыми сталкиваются авторы при создании текста: уровень владения языка, «читабельность», длина текстов.

Эксперимент: как русскоязычному пользователю научиться создавать популярные тексты на английском языке

Я много лет занимаюсь маркетингом, написанием текстов, при этом увлекаюсь английским и использую его в работе. В русскоязычном интернете в целом не так и много статей о контент-маркетинге и продвижении бизнеса в США. А те что есть часто просто рассказывают как надо делать на разборе каких-то конкретных ошибок.

Я подумала, что стоит сравнить подход к созданию контента, который используют авторы-носители языка и мы, не-нейтивы, когда пишем на английском. И вот вам результаты моего эксперимента.

Примечание: методология мини-исследования не особенно научная, но, на мой взгляд практическая. Мне полученные результаты кажутся интересными и полезными, но не стоит считать их истиной в последней инстанции.

Введение: что будем анализировать

Для начала мне нужно было найти какую-то возможность собрать в одном месте англоязычные статьи изначально русскоязычных авторов, которые «варятся» в нашем сегменте сети, но хотели бы донести свой контент до международной аудитории. Такое собрание русско-английского контента для анализа я нашла на Хабре.

Не так давно там появилась англоязычная версия, возможность ведения дискуссий на английском. Проблема в том, что пока не похоже, чтобы контент, который на английском пишут русскоязычные пользователи, интересовал иностранцев.

Успешность статей одних и тех же авторов на русском и английском значительно отличается. Чтобы понять, почему так, я решила для начала оценить то, какой контент они создают.

Методология

Я не считаю себя экспертом достаточно высокого уровня, что оценить это самостоятельно, и знакомых редакторов-носителей, которые бы бесплатно помогли с этим, тоже нет. Поэтому я буду использовать три инструмента оценки текста и исправления ошибок. Это Grammarly, Linguix и ProWritingAid. Я активно пользуюсь первыми двумя (плачу за две подписки – у Grammarly отличный веб-редактор, а в Linguix более шустрое расширение для браузера – сейчас его обсуждают на ProductHunt), ProWritingAid встречала в паре обзоров и решила взять в качестве «третьего мнения».

Все эти инструменты относятся к категории Writing assistance software, то есть они находят ошибки в английских текстах, предлагают способы их исправления, помогают оценить «читабельность» получившегося текста.

Гипотеза, которую мы хотим подтвердить или опровергнуть – англоязычные тексты русскоязычных авторов плохо читают потому что:

  • уровень их познаний в английском недостаточно хорош;
  • они пишут слишком сложно, тогда как носители предпочитают легкость;
  • тексты в целом не в том формате, что любит зарубежная аудитория.

Мы будем смотреть на:

  • длину статей,
  • количество ошибок на слово,
  • показатель «читабельности» (readability).

Для наглядности, лучшие по рейтингу статьи с англоязычного Хабра затем мы сравним с топовыми статьями, попавшими на главную страницу сайта Hacker News – топовая американская площадка по теме стартапов и технологий.

Ну вот и все, поехали!

Уровень владения английским: авторы рунета vs иностранцы

Для анализа я взяла 10 статей с Хабра. В их число вошли материалы из списка лучших за год, за месяц, корпоративных блогов, и свежих постов частных авторов. Общий объем текста – 22437 слов.

  • Grammarly нашел в этом объеме текста всего 986 ошибки, то есть по ошибке примерно на каждые 23 слова.
  • Linguix показал похожий результат – 933 ошибки, то есть по ошибке на каждые 24 слова.
  • В свою очередь ProWritingAid повел себя довольно странно – в некоторых статьях, где первые два чекера нашли, например, по 88 и 100 ошибок, он мог показать всего 50. Это можно было бы объяснить тем, что у меня нет премиума в этом сервисе, но были и случаи, когда Grammarly и Linguix выдавали максимум 160 алертов, а PWA генерировал более 350. В итоге он показал 1343 оповещений об ошибках. То есть ошибка приходилась на каждые 16 слов. Разница слишком велика, чтобы быть правдой.
​Ошибки, которые интеллектуальные ассистенты находят в англоязычных статьях русскоязычных авторов
​Ошибки, которые интеллектуальные ассистенты находят в англоязычных статьях русскоязычных авторов

Но сравним эти показатели с тем, что софт продемонстрировал при оценке контента зарубежных авторов.

Объем англоязычных публикаций вышел на 22631 слов. Для этого объема Grammarly обнаружил 617 ошибок (1 ошибка на 36 слов), Linguix нашел 421 ошибку (ошибка на 53 слова), PWA обнаружил 542 ошибки (ошибка на 41 слово) – но тут опять не обошлось без аномалий.

В целом же результат красноречив – у авторов рунета, пишущих на английском языке на каждые 20-25 слов приходится ошибка, тогда как у иностранных авторов софт проверки грамматики генерирует рекомендации (то есть это даже не обязательно грубые ошибки) один раз на 30-40 слов.

«Читабельность» текстов

Понятно, что носители языка пишут на нем с меньшим количеством ошибок. Но ведь если статья интересная, ее даже с ошибками должны читать неплохо, а этого не наблюдается с постами из нашей подборки. Значит, влияет не только число ошибок на слово, а что-то еще.

В английском языке есть понятие readability – то есть сложности текста для восприятия. Часто эти уровни связывают с уровнем образования – например, «текст настолько сложен, что его поймут только люди с университетским образованием» или наоборот, «текст настолько прост, что будет легко понят человеком с 8 классами образования».

Хорошим показателем читабельности считается уровень в 60-70 баллов – в таком случае текст смогут без усилий понять около 80% носителей английского языка. Grammarly и Linguix в своих редакторах бесплатно дают данные по Readability наряду с другой статистикой, а ProWritingAid бесплатно анализирует читабельность только первых 500 слов. Поэтому в данном сегменте у нас будут данные от двух сервисов, где у меня уже был премиум-доступ.

Для материалов на английском от русскоязычных авторов по версии Grammarly средний показатель readability составил 55,5. Средняя оценка по версии Linguix – 57,3. Вообще оба сервиса дают почти одинаковые оценки читабельности, разница не больше пары баллов. Как видно, до желаемых 60 баллов читабельности материалы наших авторов (причем и тех, кто ведет корпоративные блоги) не дотягивают.

Эксперимент: как русскоязычному пользователю научиться создавать популярные тексты на английском языке

Какова же ситуация с контентом зарубежных авторов? Grammarly выдал средний бал по readability для таких статей на уровне 77,8. Linguix – 75,4. Опять разрыв между двумя сервисами невелик. Куда больше он между нашими и не-нашими авторами.

Еще один вывод – нам труднее писать доступные тексты. Это распространенная «болезнь» не-носителей – хочется «накрутить» текст посерьезнее, в итоге же он трудно читается.

Длина текстов

В этом эксперименте мы рассматриваем материалы в формате блог-постов от частных и корпоративных авторов. В рамках этой категории возможны различные форматы публикаций.

Отечественные авторы часто публикуют достаточно длинные материалы – объем в 22437 слов уложился в десять статей. То есть средний объем равен 2243,7 слова.

Чтобы набрать схожий объем (22631 слово) материала для анализа англоязычного контента понадобилось 13 статей. Средний объем материалов - около 1740 слов.

Что все это значит

По итогам моего пусть достаточно поверхностного и не особенно научного, но практического анализа, можно сказать следующее:

Если вы хотите, чтобы вас читали иностранцы, пишите как иностранец!

На практике это означает ровно три вещи:

  • Вычитывайте свои статьи. Наймите корректора (если вы – компания), а если его нет – используйте сервисы автоматической проверки (или комбо из таких сервисов – это мой вариант).
  • Стремитесь сделать тексты максимально простыми. Читайте больше англоязычных блог-постов, чтобы учиться стилю. Через какое-то время вам будет легче находить излишне сложные конструкции в своих текстах.
  • Пишите короче. Потребители англоязычного контента предпочитают не особенно длинные статьи – на эту тему есть ряд исследований. Так что для большего эффекта стоит отказаться от лонгридов по любому поводу.

На сегодня все, спасибо за внимание! Буду рада ответить на вопросы в комментариях.

3030
30 комментариев

Комментарий недоступен

3

1. Начните продавать сами. Нафиг эти издательства?! 
2. Разделите на главы и выжимки публикуйте в соцсетях. Потом начните продавать. Потом сделайте онлайн-курс. Заработаете гораздо больше, чем эти издательства.
3. Если скачиваний не было, значит надо перепаковать маркетинг. Сменить название. Сместить акценты в книге. Сделать более практическую.
4. Специалистам надо платить, а не предлагать % с будущих теоретических продаж.

5

Хоть 100500 лет за границей. Никогда не давайте переводить ненэйтивам.

2

О чём ваша книга?

1

 Не особо в курсе темы выпуска книг.
Но вот иностранное онлайн издательство, через которое многие свои IT книги продают, может пригодится.
https://leanpub.com/

1

Не соглашусь по поводу того, что неносители стараются "накрутить текст посерьезнее". Основная проблема имхо в том, что мы не выражаемся так, как они, и в результате получается "русский текст английскими словами", а не английский текст. Причем он может быть без ошибок, без наворотов и сложносочиненных предложений. Сервисы, приведенные в статье, покажут, что все ок. Но носителям такое читать будет не особо

2

 мы не выражаемся так, как они, и в результате получается "русский текст английскими словами"

это передал гениальнейший анекдот про «МГИМО финишд» 

2