我查看了一些 Java HtmlParser(Jericho、HtmlCLeaner、...),但找不到在检索页面时将 html 框架标记替换为实际源代码的功能。
有谁知道这样做的任何解析器?
回答:
像Phani表示我需要一个Html Scraper(不是解析器,更清洁)
HtmlUnit似乎可以解决问题:http: //htmlunit.sourceforge.net/frame-howto.html
我查看了一些 Java HtmlParser(Jericho、HtmlCLeaner、...),但找不到在检索页面时将 html 框架标记替换为实际源代码的功能。
有谁知道这样做的任何解析器?
回答:
像Phani表示我需要一个Html Scraper(不是解析器,更清洁)
HtmlUnit似乎可以解决问题:http: //htmlunit.sourceforge.net/frame-howto.html