2

我有一个项目需要将 MHT 文档转换为 PDF 格式。文件为大尺寸图纸(C、D、E)。这些文档被手动加载到我的 Web 应用程序(Unix AIX 上的 Apache/Tomcat)中,并且要求将文件上的 MHT 文件转换为更便携的文件。

我将项目分为两个步骤:1)MHT 到 HTML 提取(带图像) 2)HTML 到 PDF 转换。

对于第 1 步,感谢这个链接How to read or parse MHTML (.mht) files in java,我能够想出一个用于提取和创建 HTML 文件的 java 解决方案。它运行良好。我不得不稍微增强代码以适应我的环境。

对于第 2 步,事情变得有些困难。我开始研究 html2doc 软件http://www.msweet.org/projects.php?Z1,花了几天时间构建代码后,我发现它只处理字母和法律大小的文档。我开始查看 wkhtmltopdf http://wkhtmltopdf.org/,但构建它本身已成为一项任务。总的来说,AIX Unix 并不是构建应用程序最友好的环境,而且大多数选项都在其他操作系统中运行。我尽可能使用 xlc 编译器。我想要一个java解决方案,但任何解决方案只要执行就可以了。

4

0 回答 0