SEO
Aleksandr Betra
3706

Да, блог, написанный ИИ, может ранжироваться — и это пугает

Несколько недель назад OpenAI наконец-то выпустила полную версию GPT‑2, самого современного генератора текста, которую компания ранее называла «слишком опасной для публичного выпуска».

В закладки
Аудио

Это вольный перевод статьи на английском языке. Оригинал по ссылке.

Новые инструменты, подобные GPT-2, знаменуют новую эру в создании контента с огромными последствиями для органического поиска и SEO в целом. Способность генерировать неограниченное количество текста, который читатели (и, вероятно, поисковые системы) считают написанным человеком, представляет потенциальную угрозу для качества поисковой выдачи.

Учитывая это, я решила провести эксперимент. Я создала блог, полностью сгенерированный AI, под названием This Marketing Blog Does Not Exist.

Я задалась вопросом: может ли этот блог ранжироваться в Google? Может ли привлечь трафик? Наложит ли Google санкции или ограничения?

И самое главное: действительно ли это новая жизнеспособная Black Hat техника, которую могут использовать SEO-специалисты для получения финансовой выгоды?

Что было сделано

После публикации блога, благодаря целенаправленной работе с PR, мы смогли обеспечить несколько интервью и освещение в прессе ведущими интернет-изданиями.

В результате мы получили ссылки с авторитетных доменов:

Эти первые публикации в СМИ породили дополнительную волну публикаций в менее значимых СМИ, а также, по крайней мере, одну крупную публикацию в Venture Beat.

На графике ниже можно увидеть рост количества доменов, ссылающихся на блог:

Количество уникальных доменов, ссылающихся на блог​

За примерно 4‑5 месяцев прошедших с момента запуска блога, он получил ссылки с 220 уникальных доменов, причем 50+ из которых имеют авторитет 50 или выше.

Это заложило основу для относительно быстрой индексации всего сайта (заняло около месяца), а также для раннего повышения авторитетности домена, что позволило блогу начать ранжироваться по long‑tail ключевым словам практически сразу.

Количество ранжирующихся ключевых слов

Хочу отметить, что я не проводила SEO оптимизацию страниц блога. Я просто загрузила текст, сгенерированный AI, не осуществляя дополнительной оптимизации под конкретные ключевые слова, не анализируя и изменяя полноты статьи, не оптимизируя заголовки, мета-теги, и не проводя перелинковку страниц (кроме использования стандартных для WordPress категорий страниц).

С учетом всего перечисленного, по данным SEMRush, сайт начал ранжироваться по около 300 ключевым словам спустя 4 месяца после запуска.

Всего ранжирующихся ключевых слов: 292

Позиций в топ-10 Google: 3

Ежемесячный органический трафик: около 60 посещений в месяц

Что все это значит?

Очевидно, что освещение в прессе дало большое количество ранних ссылок с авторитетных доменов, что послужило основой для ранжирования примерно 600 сгенерированных страниц.

Но поскольку это был совершенно новый домен, ссылки в прессе не позволили достигнуть высоких результатов. 215 уникальных доменов — это отличное начало, но этого явно недостаточно, чтобы ранжироваться на первой странице по short-tail ключевым словам.

Если бы я уделила больше внимания планированию и усилиям по перелинковке и SEO оптимизации страниц, я уверена, что результаты по ключевым словам / трафику были бы лучше.

Создание 600 страниц блога заняло всего 20 минут. Добавление дополнительных страниц, скорее всего, привело бы к соответствующему улучшению ранжирования страниц и увеличению органического поискового трафика.

Экстраполируя результаты, полученные на 600 страницах, можно предположить следующее:

  • Увеличение до 6000 генерируемых AI страниц может означать:
    ~ 3000 ранжируемых ключевых слов
    ~ 600 посещений блога в месяц
  • Увеличение до 60000 сгенерированных AI страниц может означать:
    ~ 30 000 ранжируемых ключевых слов
    ~ 6000 посещений в месяц
  • SEO оптимизация страниц блога, улучшение структуры сайта, перелинкова станиц могли бы возыметь огромный эффект, особенно на сайтах большего размера.

По сути, сейчас стало возможным создать очень посещаемый блог всего за один день и без единого слова, написанного человеком.

Что дальше?

Как и ожидалось, некоторые компании уже начали использовать сгенерированный AI контент для SEO.

KafkAI является одной из таких компаний; Вероятно, мы увидим, что все больше компаний будут пытаться заработать на сгенерированном AI контенте, что еще больше пошатнет позиции компаний, создающих контент низкого и среднего качества.

Я рассматриваю появление этой технологии как потенциальный риск для контент маркетинга и способности Google продолжать предоставлять релевантный контент в выдаче.

Google действительно стремится использовать все больше современных AI решений в своих алгоритмах, но пока кажется, что это не включает в себя попытки идентифицировать или фильтровать контент, сгенерированный AI.

Возможно, продолжение дискуссии о рисках для релевантности поисковой выдачи и потенциальной общей деградации экосистемы контента в сети подстегнет новые усилия Google по поиску и фильтрации следующего поколения веб-спама.

Материал опубликован пользователем.
Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Aleksandr Betra", "author_type": "self", "tags": [], "comments": 31, "likes": 21, "favorites": 53, "is_advertisement": false, "subsite_label": "seo", "id": 98217, "is_wide": false, "is_ugc": true, "date": "Thu, 19 Dec 2019 23:23:37 +0300", "is_special": false }
0
31 комментарий
Популярные
По порядку
Написать комментарий...
3

С таким успехом, когда-нибудь выпустят книгу от автора A.I. Пушкин.

Ответить
21

AI да Пушкин, AI да машин лёрниг сын! 

Ответить
7

Время Дорвеев 2.0. 

Ответить
4

Автор немного лукавит. The Verge сослался на этот мусорный блог в статье, которая как раз таки описывает феномен мусорного AI-блога. 

Но сам блог довольно реалистичный, темы интересные поднимаются. Чем-то похоже на блог Сета Година - читаешь, читаешь, вроде классно всё, но можно и не читать, ничего не поменяется. Кстати, вот идея для мотивационных блогов - загрузить в нейросеть корпус блог-постов Сета и получить на выходе новые тексты в незанятой нише. Да чего стесняться - уже на vcru достаточно набралось материалов, чтобы можно было стартаперские блоги запускать.

Ответить
2

С такими ссылками любой блог взлетит

Ответить
1

Текст не содержит ai

Ответить
0

Russian-gpt-2 гугли это

Ответить
1

Без ручного вмешательства(правки) такие сайты далеко не пойдут. Да и глубинное обучение на чем-то проводят. То есть, нейронка не узнает новых фактов и вариаций, тем самым уровень текстов останется на одинаковом уровне, а Гугл уже догонит и накажет. Или пару жалоб кто-то кинет)

Ответить
1

Я писал об этом алгоритме в своей статье об AI SEO. Более того, недавно я решил проверить поймут ли носители языка, что статья сгенерирована. В общем, тема рабочая. Статья, написанная роботом, прошла модерацию, была опубликована, ссылка заработана.

Ответить
0

"GPT-2" - Скучное название. Нужно называть поярче. Например, "СмертьРерайтеров".

Ответить
1

Лучше так: Рерайтер3000мега

Ответить
0

ОдинРерайтерИксБет!

Ответить
0

Я надеюсь недавно запущенный алгоритм BERT, отсечёт всю AI-шелуху и освободит место в выдаче человеческим сайтам

Ответить
1

смешная шутка

Ответить
0

Он скооперируется с GPT-2 и будет пропускать его тексты в выдачу за проценты с рекламы 

Ответить
0

Круто! Сейчас запущу исходник.

Ответить
0

Поделитесь результатами, интересно) 

Ответить
2

Все, сделал.

1. git clone https://github.com/nshepperd/gpt-2.git
2. pip (or conda) install -r requirements.txt
3. python download_model.py 117M

На русском языке тоже можно генерить тексты, но она достаточно тупая, ее нужно учить. Хотя, я нашел модуль: https://github.com/minimaxir/gpt-2-simple - как я понял, с его помощью можно быстро обучить модели.

Ответить
0

Спасибо! 

Ответить
0

Расскажите подробнее?

Ответить
0

Всем читать IPhuck 10 Пелевин. Кто ещё не в теме. Дайте ссылку пожалуйста протестировать где генерить. 

Ответить
0

Так все книжки под авторством Пелевина и так ИИ генерит, тоже мне, Америку октрыл

Ответить
0

Статья  переведена Алисой из Яндекса.

Ответить
0

60 визитов в месяц? Или 60 тысяч?

Ответить
0

Да ничего не будет. Роботы смотрят на контент глазами пользователей. Поисковики по поведенческим быстро понимают что за текст) И судя по соотношению трафика и количества ссылок, то это провал. У меня такой трафик на пустом домене без текста будет) 

Ответить
0

Уверен через пару лет все изменится. Будем генерить через api. Я думаю будет лучше, чем пишет неудавшийся стоматолог про ремонт бетононасоса. 

Ответить
0

60 визитов в месяц??? с 600 страниц?

Такой трафик можно получить с пары качественных статей. Зачем генерить кучу г....на?

Ответить
0

600 с 6000
6000 с 60000
60000 с 600000
.......

А сколько таких страниц АИ может генерить в день?

Ответить
0

А если ещё научить ссылаться на уже написанный текст, это вообще бомба будет. 

Ответить
0

Я его читал уже 10 дней назад,  я обязан помнить что там в тексте сказано, а что нет?

Ответить
0

 смогли обеспечить несколько интервью и освещение в прессе ведущими интернет-изданиями.

и это расскажите как сделали в подробностях

Ответить

Прямой эфир