Что такое дублированный контент и как я могу избежать наказания за него на моем сайте?

36

Это общий вики-вопрос сообщества, касающийся дублирующегося контента.

Если ваш вопрос был закрыт как дубликат этого вопроса, и вы считаете, что информация, представленная здесь, не дает достаточного ответа, пожалуйста, откройте дискуссию о Pro Webmasters Meta .


  1. Что Google считает дублирующим контентом?
  2. Приведет ли способ представления моего контента к штрафу за дублирование контента?
  3. Как я могу избежать, чтобы контент моего сайта рассматривался как дублированный контент?
danlefree
источник

Ответы:

31

Руководство для веб-мастеров Google Duplicate Content определяет дублированный контент (для целей поисковой оптимизации) как «существенные блоки контента внутри или между доменами, которые либо полностью совпадают с другим контентом, либо заметно схожи».

Руководство Google продолжает перечислять следующие примеры дублирующегося контента:

  • Дискуссионные форумы, которые могут создавать как обычные, так и урезанные страницы для мобильных устройств.
  • Хранить элементы, показанные или связанные через несколько разных URL
  • Версии веб-страниц только для принтера

Штрафы

Поисковые системы должны штрафовать некоторые экземпляры дублированного контента, которые предназначены для спама в их поисковом индексе, такие как:

  • скребковые сайты, которые копируют контент оптом
  • упрощенные методы вращения статей , которые генерируют «новый» контент путем выборочной замены слов в существующем контенте.

Когда поисковые системы находят дублированный контент, они могут:

  • Оштрафовать весь сайт, содержащий дублированный контент. (когда спам)
  • Выберите страницу в качестве канонического источника контента и понизьте приоритет или не индексируйте другую страницу с дублированием. (Общий)
  • Не предпринимать никаких карательных действий и проиндексировать несколько копий контента (редко)

Как избежать внутреннего дублирования

Отвечая на вопрос о дублирующемся контенте, Мэтт Каттс из Google сказал, что это должно причинить вам вред только в том случае, если оно выглядит спамом , однако многие веб-мастера используют следующие методы, чтобы избежать ненужного дублирования контента:

  • Убедитесь, что контент доступен только по одному каноническому URL
  • Если ваш сайт должен возвращать один и тот же контент по нескольким URL-адресам (например, для страницы «представление печати»), укажите канонический URL-адрес вручную с элементом ссылки в заголовке документа.
  • В тех случаях, когда ваш сайт возвращает аналогичный контент на основе параметров, закодированных в URL (например, сортировка каталога товаров), исключите параметры URL в Google Webmaster Tools

Синдикация контента

Публикация контента на вашем сайте, который был опубликован в другом месте, называется синдикацией контента. Создание дублированного контента через синдикацию контента может быть в порядке:

  • Пока у вас есть разрешение на это
  • Вы говорите своим пользователям, что такое контент и откуда он взялся
  • Вы ссылаетесь на первоисточник (прямая глубокая ссылка на оригинальное содержание со страницы с копией, а не просто ссылка на домашнюю страницу сайта, где можно найти оригинал)
  • Ваши пользователи находят это полезным
  • У вас есть что добавить к этому контенту, так что пользователи скорее найдут этот контент на вашем сайте, чем где-либо еще. (Комментарий или критика, например.)
  • На вашем сайте достаточно оригинального контента (не менее 50% оригинала, но в идеале 80% оригинала)

Хотя Google не наказывает за каждый экземпляр дублированного контента, даже не наказанный дубликат контента может не помочь вам получить посетителей:

  • Вы конкурируете со всеми остальными копиями, которые есть
  • Google, скорее всего, предпочтет оригинальный источник контента и наиболее авторитетную копию контента.

Google будет оштрафовывать дублированный контент, опубликованный на вашем сайте из других источников, если:

  • Похоже, что царапан или украден (особенно без указания авторства).
  • Пользователи плохо реагируют на это (особенно после перехода на сайт после перехода на Google).
  • Там так много копий, что нет причин отправлять пользователям ваши копии.
  • Ваша копия не является оригинальной, наиболее уважаемой или наиболее пригодной для использования; и не имеет никаких комментариев или критики.
  • На вашем сайте недостаточно оригинального контента, чтобы сбалансировать весь переизданный контент.
  • Вы так часто дублируете страницы на своем собственном сайте, что робот Googlebot не может сканировать весь сайт.

Интернационализация и геотаргетинг

Локализация контента - это одна из областей, в которой дублирование контента может быть полезным для SEO. Прекрасно публиковать один и тот же контент на сайтах, ориентированных на разные страны, которые говорят на одном языке. Например, у вас может быть сайт в США, сайт в Великобритании и сайт в Австралии с одинаковым содержанием.

С сайтом для каждой страны обычно возможно ранжирование лучше для пользователей в этой стране. Кроме того, есть возможность специально обслуживать пользователей в каждой стране с небольшими правописанием, ценами в валюте страны или вариантами доставки товаров. Для получения дополнительной информации о настройке гео-ориентированных веб-сайтов см. Как мне структурировать свои URL как для SEO, так и для локализации?

Работа с скребками контента

Другие сайты, которые крадут ваш контент и публикуют его без разрешения, могут иногда вызывать проблемы с дублированным контентом для вашего сайта. Поисковые системы прилагают все усилия, чтобы гарантировать, что скребковым сайтам будет сложно извлечь выгоду из дублирования вашего контента . Если скребковый сайт вызывает у вас проблемы, то возможно удалить сайт из индекса Google, заполнив запрос DMCA в Google.

Стивен Остермиллер
источник
0

Проще говоря, дублированный контент копируется контент из других веб-источников или с вашего собственного сайта (один и тот же контент на нескольких страницах).

Google может легко определить, является ли это уникальным контентом или контентом плагиата.

Лучше написать контент для сайта самостоятельно, а также не повторять один и тот же контент на нескольких страницах.

Если на вашем веб-сайте есть дублированный контент, вы не можете быть на первой странице Google, и вы будете оштрафованы согласно правилам Google, и, кроме того, вы не окажетесь на 100 позициях также в SERP.

cstpl123
источник
Дубликат не нужно копировать из других источников. Это также может быть на вашем собственном сайте. Если несколько URL-адресов могут обслуживать один и тот же контент, независимо от того, где он изначально находился, это дублированный контент.
Джон Конде