我正在使用 Cobra 解析引擎,我希望获取已解析页面的 HTML 代码(例如,在执行 javascripts 之后)。有可能吗?如果需要,Cobra 可以替换为另一个开源 Java Web 解析器。
问问题
125 次
1 回答
2
哇,Cobra 似乎确实做到了:使用示例
它实际上为您提供了一棵 HTML DOM 节点树。如果您愿意,可以使用HTMLWriter来获取 HTML-Text,但如果您对其中的某些特定部分感兴趣,请使用 XPath,它比在 HTML-String 中搜索要干净得多。
于 2010-10-04T13:38:51.907 回答