0

我有一个包含'UniCNS-UCS2-H'字体的pdf,我尝试了pdfbox和pdfrenderer,它们都抛出异常:'UniCNS-UCS2-H'的未知编码

并且这个字体被包含在一个字体文件中:mingliu.ttc(它是一个真正的类型集合文件,我不知道这有关系吗?

我该怎么做才能让这两个库支持其他字体?

4

1 回答 1

2

PDF 文档中字体的编码在字体字典对象中指定。您遇到的字体是使用“UniCNS-UCS2-H”编码的,据我所知,这是中文编码的一种变体。

PDFBox 仅支持 4 种编码:

  1. PDFDoc编码
  2. 宏罗马编码
  3. 标准编码
  4. WinAnsi编码

这些是在 pdf 流内的字体字典对象中定义的
(例如.../Encoding/WinAnsiEncoding/...

当 PDFBox 遇到未知编码时,会显示您报告的异常。

有关 PDF 文档中字体的更多信息,请参阅PDF 规范的第 9.5 至 9.8 节

于 2010-07-08T16:16:23.937 回答