0

我遇到了 XPathFilter 没有解析页面中的某些链接的情况 - 可能是因为 HTML 格式错误。

我可以看到链接可以直接用 JSoup 解析。我想知道是否有一种简单的方法(可能是测试用例/钻机)确定 XPathFilter 看到了什么?

4

1 回答 1

1

您可以使用DebugParseFilter。它将转储网页的 XML 表示形式,这可能会让您了解为什么没有使用 XPath 获取内容。为此,请将 DebugParseFilter 添加到您的 parsefilters.json 文件中,就像任何其他 ParseFilter 一样。

它可能是格式错误的 HTML 或动态内容。

于 2017-06-01T13:10:45.137 回答