Примеры использования парсинга для решения конкретных задач

Задача №1.

Допустим, вам необходимо создать большой контентный проект примерно на 2-3 миллиона страниц, “загнать” все эти страницы в индекс поисковой системы Google или Яндекс, разместить баннера Adwords или РСЯ и получать пассивный доход с кликов по рекламе.

В данном случае возникает вопрос: где же взять столько контента для наполнения страниц сайта? И здесь нам может помочь парсинг. С помощью парсинга вы находите подходящий сайт-донор и парсите его контент. Далее заливаете контент в базу данных, меняете структуру страниц для придания им уникальности — и вот у вас уже потенциально готовый сайт для индексации поисковыми системами. Правда, стоит отметить, что вероятность того, что такой сайт не только проиндексируется, а и останеться в индексе, и будет стабильно приносить трафик и доход, приблизительно 50/50%.

А сейчас мы плавно переходим к секрету номер 2. Я думаю, всем очевидно, что написание уникального контента в размере 2-3 млн страниц скорее всего экономически не оправдано, особенно в рамках эксперимента. Соответственно, нам необходимо уникализировать контент, да еще и желательно так, чтобы он не был похож на обычный набор слов. В этом нам снова может помочь бот для парсинга, но уже более сложный. Бот может взять контент из вашей базы данных, перевести его при помощи онлайн переводчика, к примеру, на английский язык и потом обратно на русский. И вот у вас уже уникальный контент с вероятностью попадания и в индекс поисковой системы 80-90%.

Задача №2.

Создание нового интернет-магазина с нуля. Вы нашли хорошего поставщика и решили создать свой маленький интернет-магазин по продаже техники Apple. Вы взяли бесплатную и платную cms, развернули и настроили свой сайт, но без наличия товаров ваш магазин не сможет работать по определению :(.

Здесь опять нам на помощь приходит парсинг и автоматическая заливка товаров в интернет-магазин. Вы выбираете сайт-донор или, еще лучше, маркетплейс, чтобы фотографии товаров точно не подпадали под фильтр уникальности. И за пару дней получаете полностью заполненный товарами интернет-магазин, на который уже можно запускать контекстную рекламу и получать первые заказы, постепенно работая над приведением описаний карточек товаров к действительно уникальному виду.

Задача №3.

У вас есть большой интернет-магазин и несколько менеджеров, которые занимаются его наполнением или автоматической заливкой товаров. Вы осуществляете данную операцию изо дня в день на протяжении нескольких лет и, скорее всего, на сайте постепенно накапливаются ошибки, к примеру, товары с отсутствующим фото, ценой или их описанием.

Применив парсинг к собственному сайту, вы сможете на выходе получить полный перечень товаров в структурированном табличном виде в формате Excel. Наложив обычный фильтр по ячейкам, получите перечень товаров, у которых есть проблемы с качеством заполнения.

Задача №4.

Опять предположим, у вас уже есть интернет-магазин, который работает в конкурентной нише. Для повышения количества продаж вам необходимо “держать” цену на равне или ниже основных конкурентов. Чем же в данном случае нам может помочь парсинг?

Давайте рассмотрим по шагам:

  • Мы подбираем сайты основных конкурентов.
  • Подключаем к ним бот-парсер и начинаем парсить товары и цены.
  • Подключаем парсер к собственному сайту, парсим товары и цены с нашего сайта.
  • Сопоставляем и приводим к соответствию товары и цены с собственного сайта с товарами и ценами с сайтов конкурентов.
  • Получаем на выходе таблицу Excel с автоматическим расчетом отклонений по цене в разрезе каждого товара. Исходя из этих данных, принимаем решение о ценовой политике собственного магазина.

Стоит также отметить, что данные о товарах и ценах возможно импортировать сразу в базу данных и сравнивать/выводить с помощью языка программирования php в режиме онлайн в виде небольшого сайта.

Надеюсь, эти примеры помогут вам лучше разобраться в том, для каких целей может быть полезен парсинг. Пробуйте, и вы будете приятно удивлены полученными результатами!

Остались вопросы? Связаться с автором статьи можно через Telegram: @SolutionsStudio

44
3 комментария

Спасибо, полезная статья. Для понимания работы нового для меня инструмента - парсинга.

Данные о товарах и ценах можно выводить в виде небольшого сайта - а что для этого нужно? Установить парсер на собственный сайт, или не обязательно?

Уникальность текста после того, как его дважды прогнали через переводчик, кто-то проверял? По текст ру сколько % выдает? Или это от объема статьи зависит?
Я привык работать вручную, но автоматизация процесса могла бы освободить руки для других задач...