Я должен сделать назначение, и указано следующее:
Extract these items:
<content type="HTML">
quoted HTML payload
</content>
извлечение относится к XML-каналу. К чему конкретно относится полезная нагрузка HTML?
Многие протоколы имеют заголовок, а затем заголовок - это содержимое или полезная нагрузка . Заголовок описывает тип, длину или другие метаданные о контенте или полезной нагрузке.
Например, если вы работаете в системе Windows XP или Linux, сделайте следующее:
telnet www.google.com 80
Затем введите следующее: « [enter] GET / HTTP/1.1[enter][enter]
То, что вы здесь делаете, - это очень простой способ вручную отправить запрос HTTP в Google.
Вы увидите несколько строк, прежде чем HTML с этой страницы запустится. Это заголовки HTTP. Они обычно не отображаются вашим браузером, но используются вашим браузером для отображения контента или для других целей. Обычно, как минимум , для HTTP вам необходимо Content-Type:
и Content-Length:
заголовки , которые говорят вам , какой тип данных следует , и его длина.
В этом контексте канал оборачивает веб-страницу в свои собственные теги, чтобы определить, что это такое. Этот элемент оборачивает страницу в тег содержимого, указывая, что это html для атрибута типа.
Поэтому читатель указывает, что содержащиеся данные являются HTML-страницей (вероятно, включая теги DOCTYPE, html, head и body).