请注意:此问题是上一个问题的更精细版本。
我正在寻找一个 XPath,它可以让我在 HTML 文档中找到具有给定纯文本的元素。例如,假设我有以下 HTML:
<html>
<head>...</head>
<body>
<someElement>This can be found</someElement>
<nested>
<someOtherElement>This can <em>not</em> be found most nested</someOtherElement>
</nested>
<yetAnotherElement>This can <em>not</em> be found</yetAnotherElement>
</body>
</html>
我需要按文本搜索,并且能够<someElement>
使用以下 XPath 找到:
//*[contains(text(), 'This can be found')]
我正在寻找一个类似的 XPath,它可以让我找到<someOtherElement>
并<yetAnotherElement>
使用纯文本"This can not be found"
。以下不起作用:
//*[contains(text(), 'This can not be found')]
我知道这是因为嵌套em
元素“扰乱”了“无法找到”的文本流。是否有可能通过 XPaths 以某种方式忽略上述嵌套或类似嵌套?