Эксперимент: как русскоязычному пользователю научиться создавать популярные тексты на английском языке

Разбор основных ошибок, с которыми сталкиваются авторы при создании текста: уровень владения языка, «читабельность», длина текстов.

Я много лет занимаюсь маркетингом, написанием текстов, при этом увлекаюсь английским и использую его в работе. В русскоязычном интернете в целом не так и много статей о контент-маркетинге и продвижении бизнеса в США. А те что есть часто просто рассказывают как надо делать на разборе каких-то конкретных ошибок.

Я подумала, что стоит сравнить подход к созданию контента, который используют авторы-носители языка и мы, не-нейтивы, когда пишем на английском. И вот вам результаты моего эксперимента.

Примечание: методология мини-исследования не особенно научная, но, на мой взгляд практическая. Мне полученные результаты кажутся интересными и полезными, но не стоит считать их истиной в последней инстанции.

Введение: что будем анализировать

Для начала мне нужно было найти какую-то возможность собрать в одном месте англоязычные статьи изначально русскоязычных авторов, которые «варятся» в нашем сегменте сети, но хотели бы донести свой контент до международной аудитории. Такое собрание русско-английского контента для анализа я нашла на Хабре.

Не так давно там появилась англоязычная версия, возможность ведения дискуссий на английском. Проблема в том, что пока не похоже, чтобы контент, который на английском пишут русскоязычные пользователи, интересовал иностранцев.

Успешность статей одних и тех же авторов на русском и английском значительно отличается. Чтобы понять, почему так, я решила для начала оценить то, какой контент они создают.

Методология

Я не считаю себя экспертом достаточно высокого уровня, что оценить это самостоятельно, и знакомых редакторов-носителей, которые бы бесплатно помогли с этим, тоже нет. Поэтому я буду использовать три инструмента оценки текста и исправления ошибок. Это Grammarly, Linguix и ProWritingAid. Я активно пользуюсь первыми двумя (плачу за две подписки – у Grammarly отличный веб-редактор, а в Linguix более шустрое расширение для браузера – сейчас его обсуждают на ProductHunt), ProWritingAid встречала в паре обзоров и решила взять в качестве «третьего мнения».

Все эти инструменты относятся к категории Writing assistance software, то есть они находят ошибки в английских текстах, предлагают способы их исправления, помогают оценить «читабельность» получившегося текста.

Гипотеза, которую мы хотим подтвердить или опровергнуть – англоязычные тексты русскоязычных авторов плохо читают потому что:

  • уровень их познаний в английском недостаточно хорош;
  • они пишут слишком сложно, тогда как носители предпочитают легкость;
  • тексты в целом не в том формате, что любит зарубежная аудитория.

Мы будем смотреть на:

  • длину статей,
  • количество ошибок на слово,
  • показатель «читабельности» (readability).

Для наглядности, лучшие по рейтингу статьи с англоязычного Хабра затем мы сравним с топовыми статьями, попавшими на главную страницу сайта Hacker News – топовая американская площадка по теме стартапов и технологий.

Ну вот и все, поехали!

Уровень владения английским: авторы рунета vs иностранцы

Для анализа я взяла 10 статей с Хабра. В их число вошли материалы из списка лучших за год, за месяц, корпоративных блогов, и свежих постов частных авторов. Общий объем текста – 22437 слов.

  • Grammarly нашел в этом объеме текста всего 986 ошибки, то есть по ошибке примерно на каждые 23 слова.
  • Linguix показал похожий результат – 933 ошибки, то есть по ошибке на каждые 24 слова.
  • В свою очередь ProWritingAid повел себя довольно странно – в некоторых статьях, где первые два чекера нашли, например, по 88 и 100 ошибок, он мог показать всего 50. Это можно было бы объяснить тем, что у меня нет премиума в этом сервисе, но были и случаи, когда Grammarly и Linguix выдавали максимум 160 алертов, а PWA генерировал более 350. В итоге он показал 1343 оповещений об ошибках. То есть ошибка приходилась на каждые 16 слов. Разница слишком велика, чтобы быть правдой.
​Ошибки, которые интеллектуальные ассистенты находят в англоязычных статьях русскоязычных авторов

Но сравним эти показатели с тем, что софт продемонстрировал при оценке контента зарубежных авторов.

Объем англоязычных публикаций вышел на 22631 слов. Для этого объема Grammarly обнаружил 617 ошибок (1 ошибка на 36 слов), Linguix нашел 421 ошибку (ошибка на 53 слова), PWA обнаружил 542 ошибки (ошибка на 41 слово) – но тут опять не обошлось без аномалий.

В целом же результат красноречив – у авторов рунета, пишущих на английском языке на каждые 20-25 слов приходится ошибка, тогда как у иностранных авторов софт проверки грамматики генерирует рекомендации (то есть это даже не обязательно грубые ошибки) один раз на 30-40 слов.

«Читабельность» текстов

Понятно, что носители языка пишут на нем с меньшим количеством ошибок. Но ведь если статья интересная, ее даже с ошибками должны читать неплохо, а этого не наблюдается с постами из нашей подборки. Значит, влияет не только число ошибок на слово, а что-то еще.

В английском языке есть понятие readability – то есть сложности текста для восприятия. Часто эти уровни связывают с уровнем образования – например, «текст настолько сложен, что его поймут только люди с университетским образованием» или наоборот, «текст настолько прост, что будет легко понят человеком с 8 классами образования».

Хорошим показателем читабельности считается уровень в 60-70 баллов – в таком случае текст смогут без усилий понять около 80% носителей английского языка. Grammarly и Linguix в своих редакторах бесплатно дают данные по Readability наряду с другой статистикой, а ProWritingAid бесплатно анализирует читабельность только первых 500 слов. Поэтому в данном сегменте у нас будут данные от двух сервисов, где у меня уже был премиум-доступ.

Для материалов на английском от русскоязычных авторов по версии Grammarly средний показатель readability составил 55,5. Средняя оценка по версии Linguix – 57,3. Вообще оба сервиса дают почти одинаковые оценки читабельности, разница не больше пары баллов. Как видно, до желаемых 60 баллов читабельности материалы наших авторов (причем и тех, кто ведет корпоративные блоги) не дотягивают.

Какова же ситуация с контентом зарубежных авторов? Grammarly выдал средний бал по readability для таких статей на уровне 77,8. Linguix – 75,4. Опять разрыв между двумя сервисами невелик. Куда больше он между нашими и не-нашими авторами.

Еще один вывод – нам труднее писать доступные тексты. Это распространенная «болезнь» не-носителей – хочется «накрутить» текст посерьезнее, в итоге же он трудно читается.

Длина текстов

В этом эксперименте мы рассматриваем материалы в формате блог-постов от частных и корпоративных авторов. В рамках этой категории возможны различные форматы публикаций.

Отечественные авторы часто публикуют достаточно длинные материалы – объем в 22437 слов уложился в десять статей. То есть средний объем равен 2243,7 слова.

Чтобы набрать схожий объем (22631 слово) материала для анализа англоязычного контента понадобилось 13 статей. Средний объем материалов - около 1740 слов.

Что все это значит

По итогам моего пусть достаточно поверхностного и не особенно научного, но практического анализа, можно сказать следующее:

Если вы хотите, чтобы вас читали иностранцы, пишите как иностранец!

На практике это означает ровно три вещи:

  • Вычитывайте свои статьи. Наймите корректора (если вы – компания), а если его нет – используйте сервисы автоматической проверки (или комбо из таких сервисов – это мой вариант).
  • Стремитесь сделать тексты максимально простыми. Читайте больше англоязычных блог-постов, чтобы учиться стилю. Через какое-то время вам будет легче находить излишне сложные конструкции в своих текстах.
  • Пишите короче. Потребители англоязычного контента предпочитают не особенно длинные статьи – на эту тему есть ряд исследований. Так что для большего эффекта стоит отказаться от лонгридов по любому поводу.

На сегодня все, спасибо за внимание! Буду рада ответить на вопросы в комментариях.

0
30 комментариев
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Андрей Викторович

1. Начните продавать сами. Нафиг эти издательства?! 
2. Разделите на главы и выжимки публикуйте в соцсетях. Потом начните продавать. Потом сделайте онлайн-курс. Заработаете гораздо больше, чем эти издательства.
3. Если скачиваний не было, значит надо перепаковать маркетинг. Сменить название. Сместить акценты в книге. Сделать более практическую.
4. Специалистам надо платить, а не предлагать % с будущих теоретических продаж.

Ответить
Развернуть ветку
Василий Вахтин

Хоть 100500 лет за границей. Никогда не давайте переводить ненэйтивам.

Ответить
Развернуть ветку
globalstocks

О чём ваша книга?

Ответить
Развернуть ветку
Mike Espoo

 Не особо в курсе темы выпуска книг.
Но вот иностранное онлайн издательство, через которое многие свои IT книги продают, может пригодится.
https://leanpub.com/

Ответить
Развернуть ветку
Alexander Loginov

Не соглашусь по поводу того, что неносители стараются "накрутить текст посерьезнее". Основная проблема имхо в том, что мы не выражаемся так, как они, и в результате получается "русский текст английскими словами", а не английский текст. Причем он может быть без ошибок, без наворотов и сложносочиненных предложений. Сервисы, приведенные в статье, покажут, что все ок. Но носителям такое читать будет не особо

Ответить
Развернуть ветку
Юрий Б.
 мы не выражаемся так, как они, и в результате получается "русский текст английскими словами"

это передал гениальнейший анекдот про «МГИМО финишд» 

Ответить
Развернуть ветку
Bilguun Billy

Автор затронул весьма важный вопрос.
При работе с русскоязычными клиентами и партнёрами, постоянно вижу одну из проблем, которую описал автор - «текст настолько сложен, что его поймут только люди с университетским образованием».
У русскоязычных людей слишком академический что ли английский.
Также немаловажную роль играет тот факт, что русские и английские слова при (почти) одинаковых писаниях имеют другие значения.
Напр. Если русскоязычный имеет ввиду и пишет про реализацию проекта, то он скорее всего будет писать project realization, а не project implementation.
Также неоднократно замечал что при обращении к партнёрам и коллегам (не те которые из одной организации, а те которые работают в одной области но принадлежат другим организациям) многие пишут colleagues, а не partners.
Сам тоже делал такие ошибки (английский выучил после русского), но постоянно читал и копировал стиль англоязычных (индийцы, малайзиции и прочие не в счёт, они скорее всего деструктивно повлияют на ваш английский)) )
P.S. Идиомы это вообще отдельная тема и супер важно овладеть ими если собираетесь на рынок США

Ответить
Развернуть ветку
globalstocks

"Заходят" ли прямые переводы с русского на английский, вычитанные носителем-американцем?
Работа профессиональных американских копирайтеров (не индусов), экспертов в тематике стоит дорого. Ведь вариант перевода с русского на английский и другие языки, чьи носители представляют собой платежеспособную публику, - заметно удешевляет создание качественного контента. 

Ответить
Развернуть ветку
Alexey Praskovin

Переводы заходят. В зависимости от тематики можете даже без вычитки обойтись. Я для зарубежных проектов использую общее правило: меньше текста - больше структуры. А в структурированных посадочных тексты все равно читает 0,5% пользователей.

Ответить
Развернуть ветку
Ware Wow
в структурированных посадочных тексты все равно читает 0,5% пользователей.

А что читают тогда? На чем делается акцент, как доносится концепция?

Ответить
Развернуть ветку
Alexey Praskovin

Изображения, цитаты, видео, если уместно. Стандартная структура CTA-лендинга.

Ответить
Развернуть ветку
Ware Wow

Видео тоже никто не смотрит кстати )
Они типа может важны, но их либо не включают, либо если кто-то включил, то обычно не смотрят нормально.

Ответить
Развернуть ветку
Alexey Praskovin
Видео тоже никто не смотрит кстати )

Вот забыл уточнить :) Видео не как Youtube, а скорее как gif. А иногда и сам великий и ужасный gif, если звук не требуется. Т.е. воспроизведение без запроса от пользователя. Ну и сами понимаете: короткое, яркое, броское.

Ответить
Развернуть ветку
Олег

Нет, подлежащего в

Ответить
Развернуть ветку
globalstocks

простите, вы бот Тинькова?

Ответить
Развернуть ветку
Андрей Викторович

Да, самый тупой бот на планете

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Alexey Praskovin

Да, и он уже изрядно тут всех задолбал. Но администрации деньги не пахнут. Нейросетка крутится, баблишко мутится.

Ответить
Развернуть ветку
Mikhail Bobko

Чей-то сразу заебал? Он тут всех веселит и разряжает атмосферу

Жги, Олег!

Ответить
Развернуть ветку
Олег

Смех:)

Ответить
Развернуть ветку
Mikhail Bobko

Олег, расскажи анекдот про переводчиков!

Ответить
Развернуть ветку
Viktor Kutolkin

Помимо сложности текста, есть ещё и сложности грамматики. Нас в школе учили и пассиву, и префекту и ещё куче времён и вещей, что в общем в США стараются использовать мало.
Кроме того, ежедневный язык это в первую очередь фразы. К ним привыкли, их ассоциируют. Что-то непривычное или малоупотребительное для уха сразу тормозит процесс.
Про "накрутку для важности" - 100%, огромная разница

Ответить
Развернуть ветку
globalstocks

Даже не столько фразы, сколько идиомы. В американском английском используется множество идиом. Больше это касается речи, но и в текстах их много. 

Ответить
Развернуть ветку
Mikhail Bobko

"Если вы хотите, чтобы вас читали иностранцы, пишите как иностранец!" 

Простите, но этот вывод был очевиден и без исследования. И эта проблема неразрешима, раз Вы не носитель языка, то и писать как носитель у Вас не получится, сколько не вычитывай. Единственно решение - дать вычитать носителю языка, что дорого.

И, кстати, в этой фразе есть двусмысленность, которая может быть расценена как смысловая ошибка. "писать как иностранец" означает, в том числе, "писать как неноситель языка" "писать недостаточно хорошо". 

Ответить
Развернуть ветку
Michael Smith

В америке есть популярны сервисы, где за 5 долларов можно заказать небольшую работу. Фриланс на минималках.

И вроде там бывают заказы и небольшие тексты написать / вычитать. Никто не пробовал?

Ответить
Развернуть ветку
Платон Щукин

Интересно, сервисы в студию. Я иногда пользуюсь сервисом где реальный человек вычитывает текст, но гарантий что текст хороший - нет:)

Ответить
Развернуть ветку
Michael Smith
Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Платон Щукин

Спасибо за сервисы, узнал для себя 2 новых, ну и за пинок ещё раз посмотреть на свои тексты.

Ответить
Развернуть ветку
nicklon khokhar

Such App that are no longer on play store such as vshare market so you can download it and use that app and enjoy your work so click on the link  MYAPKLAB

Ответить
Развернуть ветку
Maria Baranova

Классный анализ)
5 лет писала для испанской аудитории. Хочу добавить:
Пишите сразу на иностранном языке, если вы не проф переводчик. Риск написать "нечитабельный" текст уменьшится. 
У каждого языка своя семантика. Если взять за основу русскоязычный текст и попробовать перевести на иностранный, скорее всего его полностью придется переписать. 

Ответить
Развернуть ветку
27 комментариев
Раскрывать всегда