问候,
我面临以下技术堆栈的问题:JWebUnit -> HtmlUnit -> Xalan。我正在尝试通过 XPATH 查找元素,但 HTML 文档的格式非常错误。
当我到达/body
XPATH 上的元素时,Xalan 停止查找元素。我相信这是因为文档包含两个<body>
标签,一个是未关闭的。
一切都适用于/html/head
or /html
。但是当我尝试/html/body
(或/html/body[1]
,//body[1]
或这些标签内的任何内容)时,我只能从 Xalan 得到 null 。
有什么办法可以解决这个问题吗?我只是无法更改 html 文档本身。感谢您的关注。
最好的问候,蒂亚戈