Страница была удалена из Google из-за DMCA, все еще ценны ее входящие ссылки?

9

Хорошо, вот что я считаю сложным вопросом:

Таким образом, у вас есть веб-сайт, на котором было сделано удаление DMCA для сообщения, которое получило огромное количество трафика, удаление DMCA может быть или не быть правильным, но у меня нет ни времени, ни ресурсов, чтобы бороться с ним в данный момент.

Мой вопрос, страница, которая была выпущена с удалением DMCA, была с тех пор скрыта от SERPS, НО пост все еще остается в моем блоге - потому что он получил такой большой объем трафика, что генерировал значительное количество обратных ссылок высокого качества .. ... таким образом, что происходит с этими обратными ссылками, страница все еще находится на сайте, но удалена (скрыта) в базе данных Google, обратные ссылки все еще имеют вес ...?

РЕДАКТИРОВАТЬ 1: При поиске в Google по ссылке отображается следующее:

В ответ на жалобу, полученную нами в соответствии с Законом США о защите авторских прав в цифровую эпоху, мы удалили 1 результат (ов) с этой страницы. Если вы хотите, вы можете прочитать жалобу DMCA, которая вызвала удаление (ы) на LumenDatabase.org.

РЕДАКТИРОВАТЬ 2 Старый сайт, с которого отправлено сообщение, существовал в течение нескольких месяцев и по-прежнему имеет rel canonicalуказание на сообщение в блоге на моем сайте, теперь выпущенное с DMCA ... Однако с rel canonicalмомента публикации с DMCA оно было проигнорировано, хотя rel canonicalостанки были направлены на мой сайт ... за что это стоит

Тимоти Кутзи
источник
Ваше второе редактирование заставляет меня думать (я ненавижу это). Вы оригинальный автор сообщения ?? Если это так, то как другой сайт утверждает, что вы украли их контент? Что-то, чтобы рассмотреть.
closetnoc
@closetnoc Я написал пост, это была деловая сделка, когда у моего (предыдущего) партнера и у меня был веб-сайт, мы согласились разделить его, и я перенес свою запись на мой новый веб-сайт, он согласился разместить rel canonicalна моем новом сайте для пост, который я написал .... Короче говоря, произошло несколько вещей - он заметил, что пост, который я написал (первоначально размещенный на нашем общем домене), начал генерировать ОГРОМНОЕ количество трафика, он испортился и подал DMCA против поста (пост получил более 100 тыс. социальных акций и упоминался в некоторых крупных публикациях) Вы думаете, что это плагиат ... основанный на объяснении выше?
Тимоти Кутзее
Плагиат это не слово. Тем не менее, если бы была подана ложная жалоба DMCA, я бы боролся с ней без колебаний. Это «ложное ругательство» по закону. Это преступление. Объясните им, что вы нам объяснили. Я бы посоветовал нанять адвоката по авторскому праву, чтобы написать письмо или два, одно - прекратить и воздержаться от вашего бывшего партнера, а другое - в борьбе с этим. Письма стоят недорого и часто быстро решают проблемы. По какой-то причине, когда адвокат вмешивается, люди начинают воспринимать вещи всерьез. Это не означает судебный процесс, это просто означает наименьшее, что вы можете сделать, чтобы убедиться, что вы выиграли.
closetnoc

Ответы:

7

Ладно. Это будет один из тех случаев, когда я проработаю этот процесс, чтобы он стал более понятным. Это будет несколько долго, но, надеюсь, не больно долго.

Начнем с самого начала?

Начав с того, что мы знаем о том, как Google работает первоначально на основе исследовательской работы Брина и Пейджа в далеком 1997 году, мы знаем несколько вещей, которые, скорее всего, до сих пор в игре.

У Google есть URL в индексе, он выбирает очередь и выбирает страницу. Код для страницы хранится в ее базе данных для различных форм обработки. Одним из процессов будет поиск новых ссылок. Любая ссылка, найденная Google, сначала будет расположена в индексе ссылок, если она существует. В противном случае ссылка будет добавлена ​​в таблицу ссылок и добавлена ​​в очередь выборки.

Любая ссылка в таблице ссылок имеет как минимум эти элементы, URL ссылки, исходный URL и текст ссылки. Вполне вероятно, что есть и другие элементы данных, однако они не способствуют обсуждению. Любая ссылка, добавленная в таблицу ссылок, имеет проверенный исходный URL, но не обязательно целевой URL. Используя в качестве примера реляционные базы данных, исходный и целевой URL-адреса могут быть идентификатором URL-адреса в таблице URL-адресов, а таблица соединения будет соединять исходный URL-адрес таблицы ссылок и элементы целевого URL-адреса с использованием идентификатора обратно в таблицу URL-адресов. Смущенный? Не будь

В любом случае, когда целевая страница не была выбрана, ссылка в таблице ссылок называется висячей ссылкой. Как только страница выбрана, ссылка в таблице ссылок завершена. Если целевой страницы не существует, то ссылка в таблице ссылок является неработающей ссылкой. Просто?

Только полные ссылки могут передавать значение. Алгоритм PageRank требует полной ссылки для вычисления значения. Все висячие и неработающие ссылки прекращают любые вычисления, используя ссылку. Ранее PR был рекурсивным процессом, который вычислял бы значения ссылок, используя таблицу ссылок снова и снова, пока значение, которое можно настроить для любой ссылки, не попадет в числовое значение, настолько малое, что оно фактически не будет иметь значения. Я уверен, что это все еще происходит как домашний процесс. Однако PR сегодня рассчитывается с использованием другого метода, подобного переходам в сети, который измеряет расстояние от одной страницы до другой с относительной важностью. Он основан на модели доверительной сети, которая была разработана для эмуляции оригинальной модели PageRank. Ссылка - это голос доверия от одной организации к другой. Хотя это становится сложнее, чем это, Вы получите картину. Он фактически делает то же самое, что и рекурсивный процесс, используя вычисления в реальном времени, хотя, вероятно, менее точные, но достаточно точные, чтобы быть надежными. Это требует полных ссылок, поскольку значения доверия (с использованием модели сети доверия) не могут быть переданы, если доверие не установлено. Помните, что ссылка - это голос доверия или ссылка в модели сети доверия. PageRank представлен как значение доверия в сети доверия.

Теперь, когда вы понимаете ссылки и насколько они важны, давайте двигаться дальше.

Для поисковой системы не имеет смысла удалять какой-либо URL. Если URL-адрес не существует в таблице URL-адресов, вы ничего не можете знать об URL-адресе и будете в замешательстве. Скорее всего, URL-адреса не удаляются, если, например, это не имеет смысла, если URL-адрес больше не существует. Однако, когда для страницы задано значение NOINDEX, тогда поисковой системе было явно дано указание НЕ индексировать страницу. Поскольку веб-страница в индексе состоит из двух вещей: URL-адреса и исходного кода HTML, на этом этапе NOINDEX эффективно удаляет страницу. Ссылки на страницу NOINDEX как минимум висят.

Теперь, когда вы знаете, как выглядит проиндексированная страница, давайте двигаться дальше.

Есть много способов, которыми поисковая система накажет веб-страницу или сайт. Одним из них является исключение из списка. Это самый серьезный из всех штрафов, на восстановление которого уходит много времени. Эту категорию штрафов вы можете подтвердить, так как на странице их нет и найти невозможно. Кроме того, консоль поиска Googles, в целом, сообщит вам, что страницы исключаются из списка. Из оставшихся штрафов штрафы применяются в фильтрах SERP.

Когда выполняется поисковый запрос, фактически к индексу сразу поступает несколько запросов, которые затем смешиваются в результирующий набор на основе части алгоритма. Оставшийся алгоритм, который мы часто называем единым целым, представляет собой серию относительно простых алгоритмов SERP. Основные алгоритмы, которые будут переупорядочивать набор результатов на основе большего количества показателей в реальном времени, таких как тренды. Из алгоритмов те, которые удаляют записи из набора результатов или серьезно понижают размещение записи в наборе результатов, называются фильтрами. Одним из примененных является фильтр, который обрабатывает DMCA, о чем свидетельствует...we have removed 1 result(s) from this page...

Итак, теперь, когда вы знаете, как применяются штрафы, подключены ли фильтры ссылок, PR и DMCA?

При этом мы знаем, что фильтр был применен, однако это не имеет ничего общего с индексом ссылок, который вычисляет PageRank. Это настолько далеко от процесса ссылки / PR, насколько это возможно. Ссылки и PR находятся в начале процесса индексации, в то время как удаление штрафной страницы DMCA находится в конце процесса запроса. На самом деле это два совершенно разных двигателя. Таким образом, хотя страница может быть удалена из-за жалобы DMCA, она фактически не удаляется из индекса, и, следовательно, ссылки на страницу и со страницы по-прежнему рассчитываются.

Ясно как грязь? Я надеюсь, что я объяснил это хорошо. Пожалуйста, дайте мне знать, если я могу кое-что прояснить для вас.

[Обновить]

Исключение, которое не относится к сценарию ОП.

@StephenOstermiller поднимает хороший вопрос, который не подрывает вышесказанное, однако я хотел бы добавить его для полноты.

Как вы хорошо знаете, оценка сайта или страницы в поиске требует многих факторов. Хотя это не так технически или мистично, как вы можете себе представить, это все же много или факторы для взвешивания. Я забыл о влиянии доверительных оценок в основном потому, что это не относится к делу ОП. Поэтому я добавляю это сюда.

Ясно, что есть сайты, которые бесполезны, такие как спам-сайты. В эту классификацию сайтов входят сайты, которые обычно злоупотребляют авторским правом. Много лет назад это было огромной проблемой, когда скребки контента создавали сайты на основе вашей тяжелой работы. Долгое время ничего не было сделано. Сайты с оригинальным контентом будут уступать скребковым сайтам довольно последовательно. Я должен знать. У меня было два PR 8 сайта, которые потеряли почти весь свой трафик из-за скребковых сайтов без каких-либо ограничений.

Однако все изменилось. И прошло всего четыре года с тех пор, как начались значительные изменения.

Для этой специальной классификации сайтов рейтинг доверия сайтов может быть значительно снижен. Это хорошо известно. Требуются годы, чтобы восстановить показатели доверия, и для некоторых сайтов это может никогда не произойти. Почему, к примеру, вы думаете, что монетизаторы доменов так хотят полностью уничтожить сайт, где сотни тысяч ожидают такого же злоупотребления? Это потому, что реальность такова, что домен может разрушить его ценность за выкупом.

Есть много факторов, которые влияют на установление доверия. Я не буду вдаваться в это здесь. Тем не менее, знайте, что доверие является основным компонентом повышения рейтинга для любого сайта.

Тем не менее, для любого сайта, который является серьезным нарушителем DMCA с довольно обширным послужным списком, можно было бы увидеть серьезный удар по его доверительной оценке. Это не тот сценарий, который описывает OP. Тем не менее, это сценарий, который я предполагаю здесь.

Ссылки и создание PageRank имеют более одного компонента. Одним из них является PageRank (авторитет) самой страницы. Для очень авторитетных страниц есть верхний предел полномочий. Страница PR 8 не будет иметь значение 8 среди ссылок на этой странице. Это часть оригинального алгоритма PageRank, предназначенного для создания более естественной кривой в PR. В противном случае было бы почти невозможно, чтобы новая страница конкурировала со страницей с высоким авторитетом даже после длительного периода времени. Значение самой ссылки оценивается с использованием нескольких факторов, включая семантическое значение текста ссылки, URL-адрес ссылки, местоположение ссылки (известность), семантическое значение блока контента, который содержит ссылку, если она применяется, и т. Д. Все ссылки оцениваются от 0 до 0,9. Расчет авторитета и оценки ссылки - это значение, передаваемое любой ссылкой.

Ну и хорошо. Так как это влияет на сайт, который является значительным нарушителем DMCA?

Значение любой входящей ссылки не обязательно будет зависеть от показателя доверия целевого сайта, поскольку значение ссылок исходит от исходного сайта. Однако любая исходящая ссылка может быть. Авторитет любого сайта, который является значительным нарушителем DMCA, будет зависеть от уровня доверия. В конце концов, власть исходит от доверия. Таким образом, значение входящей ссылки не будет передаваться через исходящие ссылки без снижения в зависимости от показателя доверия.

Это несколько меняет ответ.

Хотя это не относится к сценарию OP, существует сценарий, когда значение входящей ссылки не полностью передается через сайт с нарушением DMCA. Тем не менее, это сложный случай, и поэтому порог, прежде чем это произойдет, является значительным.

closetnoc
источник
Огромное спасибо за этот подробный ответ ... Я собираюсь оставить это открытым еще несколько дней, чтобы посмотреть, что еще может произойти ... Я собираюсь сделать немного больше исследований и задам вам несколько вопросов, прежде чем я приму ответ в на следующий день или два, если все в порядке - еще раз спасибо, что нашли время написать все это
Тимоти Кутзи
Google вернул назад запросы DMCA, чтобы стать фактором ранжирования: searchengineland.com/… Этот алгоритм нацелен на многие запросы DMCA, а не на один, как в случае с этим вопросом. Вполне возможно, что обесценивание ссылок на страницы, подавленные DMCA, могло быть частью этого обновления алгоритма. Как и в большинстве случаев, Google не говорит. Я тоже не знаю хорошего способа проверить это.
Стивен Остермиллер
Но я согласен с closetnoc в том, что Google пришлось бы писать код, чтобы специально обесценивать эти ссылки из-за того, где DMCA вписывается в процесс индексации.
Стивен Остермиллер
@StephenOstermiller Да. Я забыл об этом. По сути, механизм индекса устанавливает метрики ранга, включая связи с доменом и метриками доверия, в то время как другие объекты могут понизить рейтинг. Фильтры SERP являются динамическими. То, что упоминается в статье, похоже, представляет собой целую категорию постоянных нарушений, которые ухудшают рейтинг доверия сайтов. Если сайт получает удар по доверию, вернуть его очень сложно. Это может занять годы. Рейтинг доверия сайтов может влиять на стоимость исходящей ссылки. Когда будет больше кофеина, я посмотрю, смогу ли я понять это в ответе. Спасибо, что подняли это! Ура !!
closetnoc
@StephenOstermiller Я должен подумать о том, повлияет ли оценка доверия на ценность исходящей ссылки. Я мог бы себе это представить, но пока не уверен, как это будет работать. Я должен был бы подумать об этом немного. Это, конечно, не повлияет на ценность входящей ссылки, которую я вижу. Муравей - это та часть, которая влияет на ОП.
closetnoc
2

Ха-ха, я думаю, что на самом деле полностью понимаю этот вопрос сейчас: /

Это ВЫ получили уведомление, ссылка на СВОЙ сайт скрыта в поиске GOOGLE, ФАЙЛ все еще находится на СВОЕМ сайте, и на ДРУГОМ сайте есть множество ДРУГИХ ССЫЛК, и эти ссылки имеют вес на ВАШЕМ сайте при показе на Google, ссылающемся на ВАШ сайт, И НА ССЫЛКАХ есть ПУСТОЙ ИНФОРМАЦИЯ ОБ ИЗВЕЩЕНИИ внизу поиска Goggle. : P Я прав?

В свете этого -

Мои оригинальные ответы были бы очень полезны для людей, подающих уведомления об удалении DMCA OH! -барабанная дробь

Так вот мой ответ: нет и черт возьми, нет!

Эти конкретные ссылки, в основном, не заслуживают доверия, и вы должны быть обеспокоены тем, что они по-прежнему ссылаются на ваш сайт. С тем же успехом вы можете сделать дезаву и защитить себя. Серьезно.

Кроме того, это должны быть другие владельцы сайта, которые должны быть более обеспокоены и почему аудит ваших обратных ссылок может быть очень важным. История ассоциации такого типа, где автор публикует ссылки такого типа, будет иметь на них плохое влияние.

Вы можете сообщить другим людям, что у них плохие контентные ссылки, указывающие на ВАС и, возможно, причиняющие им вред.

Честно говоря, этот тип контента не стоит иметь для вас или для них, и вы никогда не должны полагаться на эти типы ссылок, чтобы принести пользу вашему SEO.

Краткосрочные решения могут иметь долгосрочные последствия.

Мне было интересно, почему вы продолжали вытекать информацию немного за один раз.

Norcal Johnny
источник
1
Спасибо за ваш вклад ... Пожалуйста, смотрите ответ @closetnoc, я думаю, что это более подробное и точное описание, я не думаю, что вам следует использовать в этом случае disSowow. И я, конечно, не буду описывать ссылки как ненадежные, приходящие с сайтов PR8 +, таких как TheIrishTimes, nzherald ...? Также имейте в виду, что домен, из которого отправлено сообщение, все еще указывает rel canonicalна мой сайт, даже если он больше не поддерживается из-за уведомления DMCA ...
Тимоти Кутзи
1

Интересный вопрос По моему мнению, никакие средства не будут переданы через обратные ссылки, поскольку страница не будет сканироваться или индексироваться Google, поскольку она была удалена из ее базы данных. Я считаю, что Google по-прежнему сканирует веб-страницы, которые не проиндексированы, однако я не уверен, отличается ли это, когда страница была удалена из базы данных Googles, даже если она все еще находится на сайте.

Шон Ллойд-Кларк
источник
Вы точно правы. Ссылка будет висячей, а не неработающей, и никакое значение не может быть передано, поскольку страница не будет существовать в индексе. Это включает ссылки со страницы, которая не проиндексирована. Некоторые говорят, что эти страницы существуют, даже если они не отображаются в результатах поиска, так что ссылки могут быть рассчитаны. Это может быть частично правдой. То, что страница не проиндексирована, не означает, что страница не выбрана и ссылки не рассчитаны. Это все еще возможно. Тем не менее, я предполагаю, что G не работает так усердно и может жить с разрывом в цепи. До обсуждения.
closetnoc
Посмотрите, что страница определенно существует, и Googles знает об этом, поскольку, если вы выполните точный поиск, вы получите, что In response to a complaint that we received under the US Digital Millennium Copyright Act, we have removed 1 result(s) from this page. If you wish, you may read the DMCA complaint that caused the removal(s) at LumenDatabase.org.Google знает об этом, поэтому не исключено, что ссылки могут иметь вес ....?
Тимоти Кутзи
1
@TimothyCoetzee Если вы можете найти страницу в поисковой выдаче, тогда да, количество ссылок. ... мы удалили 1 результат (ов) с этой страницы ... подсказка. Это фильтр SERP, так что да, страница существует и ссылки подсчитываются. Ура !!
closetnoc
1
Почему страница не будет сканироваться? Я не ожидаю, что Google прекратит сканирование контента, который был удален из их поисковой системы из-за DMCA.
Стивен Остермиллер