java - 已解析页面的 HTML

Question

我正在使用 Cobra 解析引擎，我希望获取已解析页面的 HTML 代码（例如，在执行 javascripts 之后）。有可能吗？如果需要，Cobra 可以替换为另一个开源 Java Web 解析器。

score 2 · Accepted Answer

哇，Cobra 似乎确实做到了：使用示例

它实际上为您提供了一棵 HTML DOM 节点树。如果您愿意，可以使用HTMLWriter来获取 HTML-Text，但如果您对其中的某些特定部分感兴趣，请使用 XPath，它比在 HTML-String 中搜索要干净得多。

1 回答 1