Что вы не можете найти в Google? [закрыто]

18

Google заявляет о своей справедливости, и в интересах компании (большую часть времени) искать в Интернете все, что у ее пауков есть. Я хочу знать:

  • Какой тип (общедоступного) контента Google не может предоставить?
  • Есть ли определенный тип контента, который Google не может получить?

Ссылки, особенно на собственную документацию Google, были бы особенно удивительными.

samthebrand
источник
Теперь, когда ЕС принял «Право быть забытым», мы уже не сможем найти ничего особенного. Вот некоторые вещи, которые были «забыты».
samthebrand

Ответы:

21

Несколько идей о типе вещей:

  1. Контент, явно запрещенный robots.txtфайлом домена, исключается из индекса Google.
  2. Сайты, которые не связаны с другими сайтами, которые Google уже знает. То есть, вероятно, существует множество веб-сайтов, которые не связаны с видимыми страницами, и эти веб-сайты никогда не будут найдены пауком Google, если они не будут вручную отправлены в Google с помощью Инструментов для веб-мастеров .
  3. Сайты, которые находятся за веб-формами, которые вам необходимо заполнить.
  4. Перепись изображений. Поскольку контент представляет собой изображения, которые часто индексируются вручную, их обычно можно найти на платных сайтах, таких как ancestry.com.

Узнайте больше о Deep Web

АМГ
источник
2
Пункт 2 это не правда. Вы можете отправить сайт в Google с помощью Инструментов для веб-мастеров , и он будет проиндексирован, даже если он не связан с другими веб-сайтами.
Алекс
Это правда. Хорошее уточнение.
АМГ
3
На самом деле я не согласен со вторым пунктом. У меня был тестовый веб-сервер на моем компьютере, и он был проиндексирован. Я нашел это, проверив журнал доступа.
Бакудан
2
Я зарегистрировал новые домены, начал их разрабатывать и обнаружил, что робот Googlebot сканирует их всего несколько дней спустя. Я думал, что это было довольно жутко, пока я не понял - я, возможно, не первый человек, которому принадлежит этот домен :) Они не раскрывают подробности, но я уверен, что они отслеживают домены, которые люди считают достаточно важными, чтобы зарегистрироваться и по крайней мере, несколько посещенных в какой-то момент, по крайней мере, в течение определенного периода времени.
Тим Пост
6

Помимо Twitter, Google не очень хорошо индексирует Tumblr . Сообщения в блоге на Tumblr легче найти с помощью поиска Tumblr. Также все на Сайтах Google не проиндексировано (или вряд ли). Если вы запустите сайт Google, получите свой собственный домен.

Небольшие блоги, которые не обновляются регулярно, часто удаляются из результатов поиска. Плюс все, что они считают сплогом .

Дэвид
источник
5

Ну, большая часть контента Twitter не индексируется Google, даже если он общедоступный. Раньше он был доступен для Google, но это уже не так, поскольку срок действия их соглашения истек.

Источник .

Alex
источник
Хотя это правда, вопрос состоит в том, что «высококачественный контент» недоступен в Google. Большинство твиттеров не соответствовало бы этим критериям :) Хотя я вижу странный твит в поиске Google.
HappyTimeGopher
4

Это зависит от того, в какой стране вы находитесь. В Германии он не показывает тысячи сайтов, которые правительство считает негодными для вас, и этот список увеличивается на тысячи каждый год.

Google - двигатель интернет-цензуры. Если вы хотите бесплатный Интернет, используйте некоторые не злые компании, такие как DuckDuckGo или другие.

Hellagot
источник
1

Сайты с таким большим количеством контента, что у Google просто не было времени (или желания) проиндексировать все это.

Сайты, на которых нет просматриваемой карты сайта и для которых требуется, чтобы Google предоставил условия поиска для доступа к результатам, доступным на сайте, могут быть проиндексированы не полностью.

Жозефина Бонапарт
источник