好吧,我最近问了一个关于将 PDF 文件变成 XML 文件然后将其返回到 PDF 文件的问题,最好与原始文件完全相同,但至少几乎相同。
我一直在尝试不同的方法,到目前为止我想出了这个。
- 用 LibreOffice 编写的文档被保存为 DocBook XML。假设它被命名为“file.xml”。
- 该文件由文件“docbook.xsl”启动的 DocBook 项目中的一组 XSL 模板解析。
- 这可以通过运行:xsltproc -o intermediate-fo-file.fo /usr/share/xml/docbook/stylesheet/nwalsh/fo/docbook.xsl file.xml
- 结果是一个中间 XSL-FO,通过运行以下命令变为 PDF: fop intermediate-fo-file.fo final.pdf
- 此 PDF 文件看起来与原始 ODT 文件几乎相同。
但是,假设我一开始有一个 PDF 文件,怎么能做同样的事情呢?有什么建议么?