0

我的文档管理应用程序涉及使用 docsplit 将包含非 ASCII Unicode 字符(日语)的 .docx 文件转换为 PDF(如果重要,通过 Ruby gem)。它在我的 Mac 上运行良好。在我的 Ubuntu 机器上,无论是通过 Ruby 调用还是直接在命令行上调用,生成的 PDF 都有字符所在的方框。奇怪的是,当我直接在 LibreOffice 中打开 .docx 文件并进行 PDF 导出时,它工作正常。因此,似乎 docsplit 如何调用 LO 在某些方面会导致 Unicode 字符处理不当。我已经搜索了文档和代码的各个部分以查找我可能需要指定的选项,但没有运气。关于为什么会发生这种情况的任何想法?

FWIW,docsplit 使用以下选项行调用 LO pdf_extractor.rb

options = "--headless --invisible  --norestore --nolockcheck --convert-to pdf --outdir #{escaped_out} #{escaped_doc}"

我注意到输出格式可以选择跟随输出过滤器 a in -pdf:output_filter_name这是我需要考虑使用的东西吗?

4

1 回答 1

0

我已经将此--headless追溯到 docsplit 传递给 LibreOffice 的选项。这会调用非 X 版本的 LO,它显然没有必要的日文字体。不幸的是,似乎没有办法将选项传递给 docsplit 来告诉它忽略--headlessLO 的选项,所以我最终会以某种方式修补或分叉代码。

于 2013-10-18T06:39:56.590 回答