1

我想在我的应用程序中解析 HTML 内容。我想使用 HtmlCleaner 来做到这一点。

我了解 HtmlCleaner 将 html 转换为 xml。我熟悉解析 xml,所以我想这样做。

我有这条线:

tagNode = new HtmlCleaner(props).clean(new URL("http://somewebsite.com"));

我得到 tagNode 内容。有没有办法查看 HtmlCleaner 返回的 XML 内容?写文件什么的,这样我就可以属性写XML解析器了。

肿瘤坏死因子。

4

1 回答 1

1

您可以将其写入文件。这是来自HtmlCleaner Java 使用

final CleanerProperties props = new CleanerProperties();
final SimpleHtmlSerializer htmlSerializer = new SimpleHtmlSerializer(props);

htmlSerializer.writeToFile(tagNode, fileName, "utf-8");

您可能需要捕获writeToFile()可能抛出的 IOException。

于 2012-11-05T10:55:48.673 回答