В Xpath я хочу выбрать элементы, которые равны определенному значению.
Пример данных XML:
<aaa id="11" >
<aaa id="21" >
<aaa id="31" ></aaa>
<bbb id="32" >
<aaa id="41" ></aaa>
<bbb id="42" ></bbb>
<ccc id="43" ></ccc>
<ddd id="44" >qwerty</ddd>
<ddd id="45" ></ddd>
<ddd id="46" ></ddd>
</bbb>
</aaa>
<bbb id="22" >
<aaa id="33" >qwerty</aaa>
<bbb id="34" ></bbb>
<ccc id="35" ></ccc>
<ddd id="36" ></ddd>
<ddd id="37" ></ddd>
<ddd id="38" ></ddd>
</bbb>
<ccc id="23" >qwerty</ccc>
<ccc id="24" ></ccc>
</aaa>
Теперь, используя XPath:
//ccc[.='qwerty']
Я получаю правильные, ожидаемые результаты:
Name Value
ccc qwerty
Теперь, используя XPath:
//aaa[.='qwerty']
Я получаю неожиданные результаты:
Name Value
aaa
aaa qwerty
И что меня особенно интересует, так это то, как выбрать любой элемент с этим значением
XPath:
//*[.='qwerty']
Я получаю очень странные неожиданные результаты:
Name Value
aaa
bbb
ddd qwerty
bbb qwerty
aaa qwerty
ccc qwerty
Может ли кто-нибудь объяснить эти результаты и как исправить мои выражения XPath, чтобы получить более ожидаемые результаты?
. =
отличается от XPathtext() =
. См соответствующего текстовых узлов отличаются от сопоставления значений строки , чтобы узнать , почему.Ответы:
Спецификация XPath. определяет строковое значение элемента как объединение (в порядке документа) всех его потомков текстовых узлов .
Этим объясняются «странные результаты».
«Лучшие» результаты можно получить, используя следующие выражения:
Вышеупомянутый выбирает каждый элемент в документе, который имеет хотя бы один дочерний текстовый узел со значением 'qwerty'.
Вышеупомянутый выбирает каждый элемент в документе, который имеет только один дочерний текстовый узел, и его значение: 'qwerty'.
источник
text()
один из возможных узловых тестов в XPath, означающий «это текстовый узел?». Другие nodetests являютсяcomment()
,processing-instruction()
или простоnode()
.Пытаться
//*[text()='qwerty']
потому что.
это ваш текущий элементисточник