Как избежать проблемы дублирования контента?

Интересно ли вам узнать о принципах дублирования контента и как сделать, чтобы ваш сайт не был несправедливо наказан Google? Хотя существуют некоторые сайты, которые пытаются обмануть поисковые системы с помощью дублированного контента, гораздо чаще встречаются бизнес сайты, содержащие одинаковые блоки текста в пределах одного и того же URL или домена…

Данная статья поможет вам выработать стратегию управления одинаковым контентом и страницами для избежания санкций за дублированный контент.

В каких случаях вы дублируете контент? Чаще всего законное дублирование контента происходит, когда компания создает одинаковый контент для похожих типов товаров, доступных по различным URL-адресам. Например:

http://www.site.com/store/customcoffeemugs
http://www.site.com/products/coffeemugs/custom
http://www.site.com/featuremerchandise/coffemugs

Другие виды дублирования контента могут включать печатную или PDF версию веб-сайта, которая содержит ту же информацию, но предназначенную для печати.

Всё это может привести к тому, что поисковый робот Google проиндексирует страницы, содержащие дублированный контент, навредив рейтингу сайта или исключив его из результатов поиска.

К счастью, изменения в настройке сайта, известные как «канонизация», позволяют проинформировать поисковых роботов Google о том, какой URL является наиболее важным, что позволит избежать наказания за дублирование контента. Это также позволяет сообщить Google о том, какие страницы должны быть проиндексированы.

Методы канонизации

1. Обработка параметров.Обработка параметров — это метод, информирующий Google о том, какие параметры URL нужно игнорировать, при этом поисковые роботы не будут сканировать области сайта, содержащие повторяющийся контент.

Например, с помощью Google Webmaster Tools вы можете задать до 15 «параметров» на вашем сайте, на которые поисковые роботы Google не должны обращать внимания. Если вы предложите слово “products” в качестве одного из игнорируемых параметров, то URL:

http://www.site.com/products/coffeemugs/custom

Google распознает как:

http://www.site.com

Таким образом, если у вас есть несколько URL-адресов, содержащих похожий контент (или достаточно похожий, чтобы считаться дублированным), но один из них важнее, поисковый робот задаст данной странице более высокий приоритет в результатах поиска и проигнорирует дублированный контент.

2. Основной домен. Многие компании предпочитают использовать различные версии URL, чтобы создать обратные ссылки на свой сайт. Например, если ваш основной URL-адрес http://www.site.com, вы можете также использовать не-WWW версии URL, такие как http://site.com. В Google Webmaster Tools можно указать основной домен, в результате чего Google будет сканировать и индексировать ваш сайт в соответствии с заданной настройкой.

Как избежать проблемы дублирования контента?
Как избежать проблемы дублирования контента?

Конечно, важно помнить, что это займет некоторое время, прежде чем Google начнет индексировать сайт по вашей рекомендации, если основной домен не был выбран изначально. Также хорошей идеей будет использование редиректа 301 для перенаправления трафика от второстепенных доменов.

3. Определение первичной страницы. Если у вас есть несколько версий одной страницы, каждая из которых содержит то, что может рассматриваться как дублированный контент, вы можете указать поисковым роботам, какая страница является основной. Например, если у вас есть два адреса …

http://www.site.com/store/customcoffeemugs

http://www.site.com/products/coffeemugs/custom

… и вы хотите, чтобы первый считался основной страницей, то в заголовке второй страницы можно включить следующий блок кода.

< link rel=»canonical» href=» http://www.site.com/store/customcoffeemugs»>

Этот код просто сообщает поисковым роботам, что содержимое второй страницы ссылается на контент первой…


Понравилась статья? Поделиться с друзьями: