pdf - 使用 unoconv 将奇怪的字符翻译从 docx/doc 转换为 pdf

Question

我正在使用 unoconv ( https://github.com/dagwieers/unoconv ) 将 DOCX 和 DOC 文件转换为 PDF，但在 PDF 中呈现某些字符时，它们通常会得到奇怪的结果。

一个特殊的问题是奇怪地翻译数字，例如，部分标签：

Get变成了罗马数字：

我感觉这与安装的字符集有关，但不知道如何调试它。

该问题的设置是一个 Django 应用程序调用一个 unix shell 脚本来转换磁盘上的文档。

score 1 · Accepted Answer

unoconv 只需以编程方式打开文件，然后将其保存/导出为所需的格式。当您使用 LibreOffice 打开文件并从 GUI 保存它时，我希望会发生同样的情况。

如果是这种情况，您可能需要使用最新的 LibreOffice 版本进行测试，如果这不能解决您的问题，请将问题报告给 LibreOffice 错误跟踪器。

1 回答 1