我想编写一个将.html转换为pdf的java代码。我使用adobe的itext api进行html到pdf的转换。但是当我将错误的html文件作为输入时,这种转换失败。(Html标签没有正确结束)因此我使用了Htmlcleaner清理坏 html 但无法获得可以重建新 html 的代码的解析器。有人知道如何从解析的 html 标签节点构建新的 html 吗?
问问题
43 次
1 回答
0
HtmlCleaner 带有一组序列化程序,您可以使用这些序列化程序,例如:
final HtmlCleaner cleaner = new HtmlCleaner();
final CleanerProperties properties = cleaner.getProperties();
final Serializer serializer = new SimpleHtmlSerializer(properties);
TagNode node = cleaner.clean("hello world");
StringWriter writer = new StringWriter();
serializer.write(node, writer, "UTF-8");
System.out.println(writer.toString());
于 2015-10-10T14:46:33.437 回答