我是使用 iText 的新手,我不知道 XMLWorkerHelper 类是如何工作的。我正在尝试创建一个方法,该方法采用包含 html 文档的字符串,将 html 转换为 pdf 文档,并将 pdf 作为字节数组返回。如果有人能指出以下代码中的错误,我将不胜感激。
Document document = new Document();
ByteArrayOutputStream baos = new ByteArrayOutputStream();
PdfWriter pdfWriter = PdfWriter.getInstance(document, baos);
document.open();
StringReader stringReader = new StringReader(articleString);
StringWriter stringWriter = new StringWriter();<br/>
Tidy tidy = new Tidy();
tidy.setXHTML(true);
tidy.parse(stringReader, stringWriter);
System.out.println("Before XMLWorkerHelper");
XMLWorkerHelper xwh = XMLWorkerHelper.getInstance();
xwh.parseXHtml(pdfWriter, document, new StringReader(stringWriter.toString()));
System.out.println("After XMLWorkerHelper");
document.close();
stringReader.close();
result = baos.toByteArray();
我正在使用的代码在上面。html 代码在变量 articleString 中。重要的部分在两个 System.out.println 语句之间。这是 Web 应用程序的一部分,System.out 将连同任何错误或异常消息一起写入服务器日志,但发生的情况是应用程序似乎只是在两个 println 语句之间终止而没有引发任何异常。因此打印了“Before XMLWorkerHelper”行,但没有打印“After XMLWorkerHelper”行。
我使用的jar文件是itextpdf-5.4.0.jar、itext-pdfa-5.4.0.jar、itext-xtra-5.4.0.jar、xmlworker-5.4.0.jar
我要转换的 html 文件只是“测试文章”,它被 jTidy 转换为
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title></title>
</head>
<body>
Tester Article
</body>
</html>
我尝试使用 iText 5.0 jar 中的旧 HTMLWorker 类代替 XMLWorkerHelper 代码,一切正常。我用来代替上面 XMLWorkerHelper 行的 HTMLWorker 代码是:
HTMLWorker htmlWorker = new HTMLWorker(document);
htmlWorker.parse(new StringReader(stringWriter.toString()));