我在构建 XPath 查询以返回我需要的各种 URL 时遇到了很多困难。下面的 XPath 查询适用于大多数情况,但是,我一直在尝试对其进行调整,以便它只返回实际页面名称包含“about”的 URL,而不是about
在目录名称中找到的 URL。
电流输出(坏):
https://www.domain.com/about/account.asp
期望的输出:
https://www.domain.com/about/about.asp
XPath
(//a[contains(@href,'about')]/@href)[1]
注意:因为我使用的是 PHP XPath 引擎,所以我只能使用 XPath 1.0 解决方案。
我很感激任何建议!
提前谢谢了!