Google отправляет HTML-формы?

10

У меня есть веб-страница, скажем, http://domain/purchaseи на этой странице у меня есть веб-форма. Пользователь, отправив эту форму (которая имеет проверку как на стороне клиента, так и на стороне сервера и не будет проверяться до тех пор, пока поля не будут заполнены надлежащим образом), будет перенаправлен на другую страницу, где он может выбрать другие элементы и указать другие настройки, а затем приобрести наш продукт. Скажем, вторая страница есть http://domain/options.

Итак, пользователь заходит на наш сайт и посещает http://domain/purchase, заполняет форму, отправляет ее, а затем будет перенаправлен на вторую страницу http://doamin/options?parameter1=value1&parameter2=value2, которая содержит параметры с первой страницы. Это очень распространено при передаче параметров между веб-страницами (или технически между URL-адресами).

Теперь я просматривал свой веб-сайт и увидел, что Google проиндексировал некоторые из моих перенаправленных веб-страниц и URL-адресов, например:

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

Это означает, что бот Google посетил нашу http://domain/purchaseстраницу, заполнил нашу форму, отправил ее и перенаправил на другой URL с соответствующими параметрами. Это единственный способ, который имеет смысл для меня. Google действительно заполняет формы?

PS: Все параметры имеют смысл, то есть они не заполнены произвольно. Например, параметр телефона на проиндексированных страницах имеет правильные номера телефонов. Как это возможно?

Саид Нямати
источник

Ответы:

8

Google может сканировать HTML-формы с 2008 года .

Выбрав значения для каждого ввода, мы генерируем, а затем пытаемся сканировать URL-адреса, которые соответствуют возможному запросу, который может сделать пользователь. Если мы удостоверимся, что веб-страница, полученная в результате нашего запроса, является действительной, интересной и содержит контент, отсутствующий в нашем индексе, мы можем включить его в наш индекс так же, как и любую другую веб-страницу.

С другой стороны, поскольку маловероятно, что GoogleBot знает правильные параметры для этих полей, может быть другое объяснение. Возможно ли, что ваши пользователи ссылаются на перенаправленные страницы?

Kat
источник
Это видео для веб-мастеров Google также охватывает оба
вопроса
Это говорит о том, что они только сканируют GET формы. Мой метод формы POST . Таким образом, не применимо. Да, почему бы и нет, URL-адреса всегда доступны для ссылок.
Саид Нямати
5
Если вы видите ?parameter1=value9&parameter2=value10в URL, они получают их; POST не встраивает переменные формы в URL.
Wooble
@ Woobie: В этом случае параметры URL, по-видимому, являются результатом перенаправления на стороне сервера после того, как форма была POST'd.
MrWhite