Руководство для веб-мастеров Google Duplicate Content определяет дублированный контент (для целей поисковой оптимизации) как «существенные блоки контента внутри или между доменами, которые либо полностью совпадают с другим контентом, либо заметно схожи».
Руководство Google продолжает перечислять следующие примеры дублирующегося контента:
- Дискуссионные форумы, которые могут создавать как обычные, так и урезанные страницы для мобильных устройств.
- Хранить элементы, показанные или связанные через несколько разных URL
- Версии веб-страниц только для принтера
Штрафы
Поисковые системы должны штрафовать некоторые экземпляры дублированного контента, которые предназначены для спама в их поисковом индексе, такие как:
- скребковые сайты, которые копируют контент оптом
- упрощенные методы вращения статей , которые генерируют «новый» контент путем выборочной замены слов в существующем контенте.
Когда поисковые системы находят дублированный контент, они могут:
- Оштрафовать весь сайт, содержащий дублированный контент. (когда спам)
- Выберите страницу в качестве канонического источника контента и понизьте приоритет или не индексируйте другую страницу с дублированием. (Общий)
- Не предпринимать никаких карательных действий и проиндексировать несколько копий контента (редко)
Как избежать внутреннего дублирования
Отвечая на вопрос о дублирующемся контенте, Мэтт Каттс из Google сказал, что это должно причинить вам вред только в том случае, если оно выглядит спамом , однако многие веб-мастера используют следующие методы, чтобы избежать ненужного дублирования контента:
- Убедитесь, что контент доступен только по одному каноническому URL
- Если ваш сайт должен возвращать один и тот же контент по нескольким URL-адресам (например, для страницы «представление печати»), укажите канонический URL-адрес вручную с элементом ссылки в заголовке документа.
- В тех случаях, когда ваш сайт возвращает аналогичный контент на основе параметров, закодированных в URL (например, сортировка каталога товаров), исключите параметры URL в Google Webmaster Tools
Синдикация контента
Публикация контента на вашем сайте, который был опубликован в другом месте, называется синдикацией контента. Создание дублированного контента через синдикацию контента может быть в порядке:
- Пока у вас есть разрешение на это
- Вы говорите своим пользователям, что такое контент и откуда он взялся
- Вы ссылаетесь на первоисточник (прямая глубокая ссылка на оригинальное содержание со страницы с копией, а не просто ссылка на домашнюю страницу сайта, где можно найти оригинал)
- Ваши пользователи находят это полезным
- У вас есть что добавить к этому контенту, так что пользователи скорее найдут этот контент на вашем сайте, чем где-либо еще. (Комментарий или критика, например.)
- На вашем сайте достаточно оригинального контента (не менее 50% оригинала, но в идеале 80% оригинала)
Хотя Google не наказывает за каждый экземпляр дублированного контента, даже не наказанный дубликат контента может не помочь вам получить посетителей:
- Вы конкурируете со всеми остальными копиями, которые есть
- Google, скорее всего, предпочтет оригинальный источник контента и наиболее авторитетную копию контента.
Google будет оштрафовывать дублированный контент, опубликованный на вашем сайте из других источников, если:
- Похоже, что царапан или украден (особенно без указания авторства).
- Пользователи плохо реагируют на это (особенно после перехода на сайт после перехода на Google).
- Там так много копий, что нет причин отправлять пользователям ваши копии.
- Ваша копия не является оригинальной, наиболее уважаемой или наиболее пригодной для использования; и не имеет никаких комментариев или критики.
- На вашем сайте недостаточно оригинального контента, чтобы сбалансировать весь переизданный контент.
- Вы так часто дублируете страницы на своем собственном сайте, что робот Googlebot не может сканировать весь сайт.
Интернационализация и геотаргетинг
Локализация контента - это одна из областей, в которой дублирование контента может быть полезным для SEO. Прекрасно публиковать один и тот же контент на сайтах, ориентированных на разные страны, которые говорят на одном языке. Например, у вас может быть сайт в США, сайт в Великобритании и сайт в Австралии с одинаковым содержанием.
С сайтом для каждой страны обычно возможно ранжирование лучше для пользователей в этой стране. Кроме того, есть возможность специально обслуживать пользователей в каждой стране с небольшими правописанием, ценами в валюте страны или вариантами доставки товаров. Для получения дополнительной информации о настройке гео-ориентированных веб-сайтов см. Как мне структурировать свои URL как для SEO, так и для локализации?
Работа с скребками контента
Другие сайты, которые крадут ваш контент и публикуют его без разрешения, могут иногда вызывать проблемы с дублированным контентом для вашего сайта. Поисковые системы прилагают все усилия, чтобы гарантировать, что скребковым сайтам будет сложно извлечь выгоду из дублирования вашего контента . Если скребковый сайт вызывает у вас проблемы, то возможно удалить сайт из индекса Google, заполнив запрос DMCA в Google.