我正在使用 unoconv ( https://github.com/dagwieers/unoconv ) 将 DOCX 和 DOC 文件转换为 PDF,但在 PDF 中呈现某些字符时,它们通常会得到奇怪的结果。
一个特殊的问题是奇怪地翻译数字,例如,部分标签:
第 2.3 节(http://note.io/1Q33RX6)
Get变成了罗马数字:
第 II.3 节(http://note.io/1b6MDs5)
我感觉这与安装的字符集有关,但不知道如何调试它。
该问题的设置是一个 Django 应用程序调用一个 unix shell 脚本来转换磁盘上的文档。