{"id":14270,"url":"\/distributions\/14270\/click?bit=1&hash=a51bb85a950ab21cdf691932d23b81e76bd428323f3fda8d1e62b0843a9e5699","title":"\u041b\u044b\u0436\u0438, \u043c\u0443\u0437\u044b\u043a\u0430 \u0438 \u0410\u043b\u044c\u0444\u0430-\u0411\u0430\u043d\u043a \u2014 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u0433\u043e\u0440\u0435","buttonText":"\u041d\u0430 \u043a\u0430\u043a\u043e\u0439?","imageUuid":"f84aced9-2f9d-5a50-9157-8e37d6ce1060"}

Да, блог, написанный ИИ, может ранжироваться — и это пугает

Несколько недель назад OpenAI наконец-то выпустила полную версию GPT‑2, самого современного генератора текста, которую компания ранее называла «слишком опасной для публичного выпуска».

Это вольный перевод статьи на английском языке. Оригинал по ссылке.

Новые инструменты, подобные GPT-2, знаменуют новую эру в создании контента с огромными последствиями для органического поиска и SEO в целом. Способность генерировать неограниченное количество текста, который читатели (и, вероятно, поисковые системы) считают написанным человеком, представляет потенциальную угрозу для качества поисковой выдачи.

Учитывая это, я решила провести эксперимент. Я создала блог, полностью сгенерированный AI, под названием This Marketing Blog Does Not Exist.

Я задалась вопросом: может ли этот блог ранжироваться в Google? Может ли привлечь трафик? Наложит ли Google санкции или ограничения?

И самое главное: действительно ли это новая жизнеспособная Black Hat техника, которую могут использовать SEO-специалисты для получения финансовой выгоды?

Что было сделано

После публикации блога, благодаря целенаправленной работе с PR, мы смогли обеспечить несколько интервью и освещение в прессе ведущими интернет-изданиями.

В результате мы получили ссылки с авторитетных доменов:

Эти первые публикации в СМИ породили дополнительную волну публикаций в менее значимых СМИ, а также, по крайней мере, одну крупную публикацию в Venture Beat.

На графике ниже можно увидеть рост количества доменов, ссылающихся на блог:

Количество уникальных доменов, ссылающихся на блог​

За примерно 4‑5 месяцев прошедших с момента запуска блога, он получил ссылки с 220 уникальных доменов, причем 50+ из которых имеют авторитет 50 или выше.

Это заложило основу для относительно быстрой индексации всего сайта (заняло около месяца), а также для раннего повышения авторитетности домена, что позволило блогу начать ранжироваться по long‑tail ключевым словам практически сразу.

Количество ранжирующихся ключевых слов

Хочу отметить, что я не проводила SEO оптимизацию страниц блога. Я просто загрузила текст, сгенерированный AI, не осуществляя дополнительной оптимизации под конкретные ключевые слова, не анализируя и изменяя полноты статьи, не оптимизируя заголовки, мета-теги, и не проводя перелинковку страниц (кроме использования стандартных для WordPress категорий страниц).

С учетом всего перечисленного, по данным SEMRush, сайт начал ранжироваться по около 300 ключевым словам спустя 4 месяца после запуска.

Всего ранжирующихся ключевых слов: 292

Позиций в топ-10 Google: 3

Ежемесячный органический трафик: около 60 посещений в месяц

Что все это значит?

Очевидно, что освещение в прессе дало большое количество ранних ссылок с авторитетных доменов, что послужило основой для ранжирования примерно 600 сгенерированных страниц.

Но поскольку это был совершенно новый домен, ссылки в прессе не позволили достигнуть высоких результатов. 215 уникальных доменов — это отличное начало, но этого явно недостаточно, чтобы ранжироваться на первой странице по short-tail ключевым словам.

Если бы я уделила больше внимания планированию и усилиям по перелинковке и SEO оптимизации страниц, я уверена, что результаты по ключевым словам / трафику были бы лучше.

Создание 600 страниц блога заняло всего 20 минут. Добавление дополнительных страниц, скорее всего, привело бы к соответствующему улучшению ранжирования страниц и увеличению органического поискового трафика.

Экстраполируя результаты, полученные на 600 страницах, можно предположить следующее:

  • Увеличение до 6000 генерируемых AI страниц может означать:
    ~ 3000 ранжируемых ключевых слов
    ~ 600 посещений блога в месяц
  • Увеличение до 60000 сгенерированных AI страниц может означать:
    ~ 30 000 ранжируемых ключевых слов
    ~ 6000 посещений в месяц
  • SEO оптимизация страниц блога, улучшение структуры сайта, перелинкова станиц могли бы возыметь огромный эффект, особенно на сайтах большего размера.

По сути, сейчас стало возможным создать очень посещаемый блог всего за один день и без единого слова, написанного человеком.

Что дальше?

Как и ожидалось, некоторые компании уже начали использовать сгенерированный AI контент для SEO.

KafkAI является одной из таких компаний; Вероятно, мы увидим, что все больше компаний будут пытаться заработать на сгенерированном AI контенте, что еще больше пошатнет позиции компаний, создающих контент низкого и среднего качества.

Я рассматриваю появление этой технологии как потенциальный риск для контент маркетинга и способности Google продолжать предоставлять релевантный контент в выдаче.

Google действительно стремится использовать все больше современных AI решений в своих алгоритмах, но пока кажется, что это не включает в себя попытки идентифицировать или фильтровать контент, сгенерированный AI.

Возможно, продолжение дискуссии о рисках для релевантности поисковой выдачи и потенциальной общей деградации экосистемы контента в сети подстегнет новые усилия Google по поиску и фильтрации следующего поколения веб-спама.

0
31 комментарий
Написать комментарий...
Андрей Андреев

С таким успехом, когда-нибудь выпустят книгу от автора A.I. Пушкин.

Ответить
Развернуть ветку
Vyacheslav.O

AI да Пушкин, AI да машин лёрниг сын! 

Ответить
Развернуть ветку
Имя Фамилия

Время Дорвеев 2.0. 

Ответить
Развернуть ветку
Юрий Б.

Автор немного лукавит. The Verge сослался на этот мусорный блог в статье, которая как раз таки описывает феномен мусорного AI-блога. 

Но сам блог довольно реалистичный, темы интересные поднимаются. Чем-то похоже на блог Сета Година - читаешь, читаешь, вроде классно всё, но можно и не читать, ничего не поменяется. Кстати, вот идея для мотивационных блогов - загрузить в нейросеть корпус блог-постов Сета и получить на выходе новые тексты в незанятой нише. Да чего стесняться - уже на vcru достаточно набралось материалов, чтобы можно было стартаперские блоги запускать.

Ответить
Развернуть ветку
Oleg Oleg

С такими ссылками любой блог взлетит

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Insta

Russian-gpt-2 гугли это

Ответить
Развернуть ветку
Aloha Nik

Без ручного вмешательства(правки) такие сайты далеко не пойдут. Да и глубинное обучение на чем-то проводят. То есть, нейронка не узнает новых фактов и вариаций, тем самым уровень текстов останется на одинаковом уровне, а Гугл уже догонит и накажет. Или пару жалоб кто-то кинет)

Ответить
Развернуть ветку
Слава Вареня

Я писал об этом алгоритме в своей статье об AI SEO. Более того, недавно я решил проверить поймут ли носители языка, что статья сгенерирована. В общем, тема рабочая. Статья, написанная роботом, прошла модерацию, была опубликована, ссылка заработана.

Ответить
Развернуть ветку
Vl Al

"GPT-2" - Скучное название. Нужно называть поярче. Например, "СмертьРерайтеров".

Ответить
Развернуть ветку
Aloha Nik

Лучше так: Рерайтер3000мега

Ответить
Развернуть ветку
Vl Al

ОдинРерайтерИксБет!

Ответить
Развернуть ветку
Aleksey Krenvalk

Я надеюсь недавно запущенный алгоритм BERT, отсечёт всю AI-шелуху и освободит место в выдаче человеческим сайтам

Ответить
Развернуть ветку
Bille Shiffer

смешная шутка

Ответить
Развернуть ветку
Александр Албул

Он скооперируется с GPT-2 и будет пропускать его тексты в выдачу за проценты с рекламы 

Ответить
Развернуть ветку
Dark Stack

Круто! Сейчас запущу исходник.

Ответить
Развернуть ветку
Данил Черепанов

Поделитесь результатами, интересно) 

Ответить
Развернуть ветку
Dark Stack

Все, сделал.

1. git clone https://github.com/nshepperd/gpt-2.git
2. pip (or conda) install -r requirements.txt
3. python download_model.py 117M

На русском языке тоже можно генерить тексты, но она достаточно тупая, ее нужно учить. Хотя, я нашел модуль: https://github.com/minimaxir/gpt-2-simple - как я понял, с его помощью можно быстро обучить модели.

Ответить
Развернуть ветку
Данил Черепанов

Спасибо! 

Ответить
Развернуть ветку
Arman Ayvazyan

Расскажите подробнее?

Ответить
Развернуть ветку
Дмитрий Коцюба

Всем читать IPhuck 10 Пелевин. Кто ещё не в теме. Дайте ссылку пожалуйста протестировать где генерить. 

Ответить
Развернуть ветку
Ватник в Америке

Так все книжки под авторством Пелевина и так ИИ генерит, тоже мне, Америку октрыл

Ответить
Развернуть ветку
Имя Фамилия

Статья  переведена Алисой из Яндекса.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Sergio Mekeda

Да ничего не будет. Роботы смотрят на контент глазами пользователей. Поисковики по поведенческим быстро понимают что за текст) И судя по соотношению трафика и количества ссылок, то это провал. У меня такой трафик на пустом домене без текста будет) 

Ответить
Развернуть ветку
Дмитрий Коцюба

Уверен через пару лет все изменится. Будем генерить через api. Я думаю будет лучше, чем пишет неудавшийся стоматолог про ремонт бетононасоса. 

Ответить
Развернуть ветку
Креативный маркетолог

60 визитов в месяц??? с 600 страниц?

Такой трафик можно получить с пары качественных статей. Зачем генерить кучу г....на?

Ответить
Развернуть ветку
Павел Андрейчук

600 с 6000
6000 с 60000
60000 с 600000
.......

А сколько таких страниц АИ может генерить в день?

Ответить
Развернуть ветку
Евгений Смирнов

А если ещё научить ссылаться на уже написанный текст, это вообще бомба будет. 

Ответить
Развернуть ветку
Павел Андрейчук

Я его читал уже 10 дней назад,  я обязан помнить что там в тексте сказано, а что нет?

Ответить
Развернуть ветку
Yan
 смогли обеспечить несколько интервью и освещение в прессе ведущими интернет-изданиями.

и это расскажите как сделали в подробностях

Ответить
Развернуть ветку
28 комментариев
Раскрывать всегда