Soft 404: пойди туда не знаю куда, принеси то, не знаю что

Сегодня расскажу про интересный случай решения неочевидной сеошной проблемы. Ошибка Soft 404 описана в документации, но реальное положение дел — то, как ошибка проявляла себя, отличалось от описанного в документации поведения. Это привело к тому, что решение растянулось на недели, а последствием стало выпадение нескольких продвигаемых страниц из индекса Google.

Soft 404: пойди туда не знаю куда, принеси то, не знаю что

Надеюсь, эта статья будет для вас полезной и пригодится как минимум для того, чтобы не допустить возникновения данной ошибки.

О чем собственно речь

В документации Google указано, что за этой ошибкой стоит отдача пользователю страницы без контента/с ошибкой и кодом ответа 200, причем боту страница отдается с контентом в исходном коде — https://support.google.com/webmasters/answer/7440203#soft_404.

Описание soft 404 в документации Google
Описание soft 404 в документации Google

Также Google дает некоторые рекомендации по устранению данной проблемы — https://developers.google.com/search/docs/crawling-indexing/http-network-errors?sjid=14836278297680420082-EU&visit_id=638630540881380096-67639067&rd=1&hl=ru#soft-404-errors. Однако в моем случае видимые симптомы, которые описываются в документации отсутствовали: при проверке страниц с ошибками через Search Console отрисовывался нормальный рендер, в кеше Google отображались полноценные страницы, код ответа страниц — 200. А страницы все равно с ошибкой 🤷‍♂

Все бы ничего, но через какое-то время из-за этой ошибки из индекса начали вываливаться целевые страницы, которые генерируют доход. И вот здесь пришлось попыхтеть.

Как я решал проблему и что в итоге помогло

В первую очередь были опробованы решения в лоб:

  • удалить/добавить контент
  • добавить внутренних и внешних ссылок
  • настойчиво отправлять страницу на индексацию через консоль / индексаторы

И..все мимо. Попросить разработчиков в сотый раз проверить SSR тоже не сработало (хотя порой бывает полезно).

Как же в итоге получилось решить проблему? Помогла наблюдательность и мое желание докопаться до сути. Проводя в сотый раз live test (Inspect any URL) в консоли Google, я заметил, что страница время от времени отрисовывается c блюром (затемнением).

И я так подумал в моменте
И я так подумал в моменте

Захожу на страницу с телефона, через пару секунд нежно приглушается свет экрана, а моему взору предстает модалка. И меня осеняет.

В случае с бизнесом, где я боролся с этой проблемой, приложение показывает лучшие, относительно веб версии продукта, метрики. И для того, чтобы сразу конвертить новых пользователей в установки приложения, им показывается модальный баннер в стиле: "Братишка, иди в прилу, там трава зеленее, солнце ярче и рейты интереснее". "И чо?", спросите вы. А то. Google время от времени ловил эту модалку и “делал” простой вывод: страница не имеет никакой ценности и держать её в индексе смысла нет, тк доступный пользователю контент не ней отсутствует (хотя в коде он конечно же присутствовал). И присваивал ей гордый статус soft 404.

В качестве теста решили оставить модалку только для пользователей, а для ботов отдавать страницу без всяких там попапов. И это сработало!!! В течение нескольких дней после отправки на переобход выпавших страниц они вернулись в индекс, а количество soft 404 страниц начало снижаться. Победа 💪

Как каждый раз я себя чувствую, когда что-то удается
Как каждый раз я себя чувствую, когда что-то удается

Вместо заключения

Можно сколько угодно прочитать постов про SEO, высшую математику и бескрайний космос, но есть проблемы, решение которых нигде не описано и даже примерно не понятно, куда копать. Решение именно таких проблем дает ощущение, что ты в этой жизни что-то да можешь.

По традиции, всем топов 🏆

******************************************************************************

Статья подготовлена автором канала SEO PM

22
5 комментариев

Кейс хороший, заберу в коллекцию. Но пара моментов.
а) Тот же гуглобот может зайти и анонимно, не как официально представляющийся бот
б) Насчёт "нигде не описано" - много раз упоминал, что софт 404 - это не шутки. Сервак может отдать оптимизированную страницу без контента, а робот её словить. CMS может быть криво настроена, и отдать реальную 404 с кодом 200. Вебмастер-шутник может настроить сервер так, что один робот получает 200, другой - 302, третьему вообще 403 (Бинг-бот обычно по носу получает).
Анализ логов и тесты решают.

2

Виктор, спасибо за комментарий!
В случае с п.1 - да, знаю) Но видимо это происходит достаточно редко, относительно общего количества заходов бота на сайт, тк количество soft 404 за год сократилось с 30к до 100 +-. Иначе модалку пришлось бы либо совсем убирать, либо увеличивать задержку для её показа пользователю.

1

У меня есть сайт где много модалок, просто каждые 30 сек новые и всё норм. Хотя это сильно отвлекает посетителя, хозяин говорит хочу так. И работает. В топе гугла по 180 запросам.
По поводу вашего случая, у меня было подобное, на одном из проектов, там дело было в фоне. Не помню суть, что то там блокировалось, убрали и проблема была решена. Возможно и вам было достаточно просто убрать фон или посмотреть на его стили и что то там поправить.

1

Да, вполне может быть, что отрабатывал блюр помимо модалки. Решили убрать все сразу и проверить

1