可以请任何人推荐能够做与这些库相反的事情的库吗?
HtmlCleaner、TagSoup、HtmlParser、HtmlUnit、jSoup、jTidy、nekoHtml、WebHarvest 或 Jericho。
我需要构建 html 页面,从字符串内容构建 DOM 模型。
编辑:我需要它用于测试目的。我有各种类型的输入/字符串,可能在不同地方的 html 页面中......所以我需要动态构建它......然后我根据必须满足或不满足的各种标准处理 html 页面。
我会告诉你为什么我问这个问题,考虑使用 htmlCleaner 来完成这项工作:
List<String> paragraphs = getParagraphs(entity.getFile());
List<TagNode> pNodes = new ArrayList<TagNode>();
TagNode html = cleaner.clean("<html/>");
for(String paragraph : paragraphs) {
TagNode p = new TagNode("p");
pNodes.add(p);
// CANNOT setText() ?
}
html.addChildren(pNodes);
问题是TagNode
有getText()
方法,但没有setText()
方法....
请添加更多关于这个问题有多模糊的评论......你能做的最好的事情