1

我的目标是使用 PDFBox 读取具有非内置编码的内容。 PDF 文档字体属性 如图所示,我能够从 PDF 中提取所有类型为 TrueType 和 Encoding Built-in的字体的文本。结果,我得到了子编码文本,而不是Type1 类型和自定义编码的内容

我收到以下文字!

实际上,pdf 中的文本是 7.+13。描述反应

无论如何,我们可以使外部字体文件可用于 pdf 并强制 pdfbox 将这些文件加载​​到文档中,以便我们将获得 pdf 中存在的实际文本。

4

0 回答 0