Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我的目标是使用 PDFBox 读取具有非内置编码的内容。 如图所示,我能够从 PDF 中提取所有类型为 TrueType 和 Encoding Built-in的字体的文本。结果,我得到了子编码文本,而不是Type1 类型和自定义编码的内容
我收到以下文字!
实际上,pdf 中的文本是 7.+13。描述反应
无论如何,我们可以使外部字体文件可用于 pdf 并强制 pdfbox 将这些文件加载到文档中,以便我们将获得 pdf 中存在的实际文本。