我有这个 html 代码,它驻留在 db 中,我想用 pdf 解析它。我正在使用 itext 生成pdf。这是db中的html:
<p>no note.</p><br>
<ul><br>
<li><strong>section</strong></li><br>
</ul><br>
<ol><br>
<li>first</li><br>
<li><em>second</em></li><br>
<li><span style="text-decoration: underline;">third</span></li><br>
</ol><br>
这是解析并插入pdf的内容:
<p>no note.</p><br>
<strong>section</strong><br>
first<br>
<em>second</em><br>
<span style="text-decoration: underline;">third</span><br>
这也是我将html解析为pdf的代码:
org.jsoup.nodes.Document doc = Jsoup.parse(text);
List<Element> objects;
objects = HTMLWorker.parseToList(new StringReader(doc.outerHtml()), null);
for (Element object : objects) {
Element ele = (Element) object;
document.add(ele);
}
可以看出,数字和项目符号没有显示(它们是 html 中的“ol”和“li”标签)。如何解决这个问题?
编辑
如需更多说明。这是我在 html 中的文本:
这是插入pdf的注释: