Считают ли поисковые системы индексные страницы с выдержками как дублирующее содержимое страниц, на которые они ссылаются?

11

Я использую WordPress, и на своей боковой панели постов у меня есть похожие посты, которые могут представлять интерес для пользователя, однако у меня также есть выдержка из каждой статьи, которая обычно является первым абзацем поста, на который она ссылается.

Например:

http://musicdune.com/reviews/album-review-ellie-goulding-lights

Если вы выполните поиск Google для первой выдержки в разделе публикаций с этой страницы, вы получите 4-5 результатов из моего домена, http://www.google.co.uk/search?sourceid=chrome&ie=UTF-8&q= Strip + назад + в + синтезаторы, + быстро + ударов + и + кнопки + другой + поп + элементы + и + вы% E2% 80% 99re + левый + с + что - то + элегантный + и + проникновенный

Рекомендуется ли удалить выдержку из соответствующих постов?

Перри Ропер
источник
Чтобы проверить, есть ли у вас дублированный контент, используйте инструменты для веб-мастеров от Google. google.com/webmasters/tools/?hl=es
llazzaro
Мне было интересно, аналогично, в отношении стандартного описания сайта, который появляется на каждой странице. Я думаю, что аргумент толерантности имеет некоторый вес, по крайней мере, я надеюсь, что он имеет :)

Ответы:

4

Это не дублированный контент, и очень много результатов в верхней части результатов поиска. На страницах будет дублированный контент, и это нормально. Повторяющееся содержимое становится проблемой только тогда, когда два или более URL-адреса получают одно и то же содержимое. Я бы не стал ничего менять.

Джон Конде
источник
4

У большинства сайтов есть частичное дублирование контента в некоторой степени. Если это не навигация, это информация об оттиске, колофон или другой текст верхнего / нижнего колонтитула. Так что я уверен, что Google допускает некоторый уровень дублированного контента.

Это все о градусах. Если контент между страницами перекрывается только на 5-6%, то, вероятно, все будет хорошо. Выдержки не так уж редки в Интернете.

Тем не менее, я был бы уверен, чтобы отметить это семантически. Несмотря на то, что HTML5 все еще находится в зачаточном состоянии, и Google, вероятно, еще не начал анализировать теги содержимого HTML5, вы хотите сделать свой сайт ориентированным на будущее, разработав свой сайт в зависимости от того, куда движутся поисковые системы.

Так что средства ввода выдержки в <blockquote cite="url">с <cite>элементом внизу. И поставить всю боковую панель в <aside>. Это позволяет анализатору документов знать, что он не является частью основного содержимого. Это даст поисковым системам лучший шанс понять, что это не дублированный контент.

Лез Мажесте
источник
-1

Я согласен, что это не дублированный контент. Кроме того, за дублирующийся контент штраф не взимается. Этот вид контента просто игнорируется.

Дублированный контент - это когда вы берете чужую работу и публикуете ее как свою.

http://www.google.com/support/webmasters/bin/answer.py?answer=66359

SEOThomas
источник
1
Я знаю, что это старый ответ, но он неправильный. Существует штраф за дублирующийся контент, когда дело касается поисковых систем, это может привести к удалению вас из их индекса. Это БОЛЬШОЙ штраф. Принимать чужую работу и публиковать ее как свою - это не то, что подразумевается, когда люди говорят о дублирующемся контенте, это нарушение авторских прав, а это совсем другое.
Шервин Рейс
-1 и за этот ответ
Шервин Рейс
1
От Google. В тех редких случаях, когда Google обнаруживает, что дублированный контент может отображаться с намерением манипулировать нашими рейтингами и обманывать наших пользователей, мы также внесем соответствующие коррективы в индексацию и ранжирование соответствующих сайтов. В результате рейтинг сайта может пострадать или сайт может быть полностью удален из индекса Google, и в этом случае он больше не будет отображаться в результатах поиска.
Шервин Рейс