使用Jpedal解析PDF时遇到问题。
wordlist
从 Jpedal阅读时,我在wordslist
. 使用OCR以及从 PDF 复制文本并粘贴到 Word 或简单文本编辑器时也会发生这种情况。我的理解是这个 PDF 是由MAC OS X 10.6.4上的Quartz PDF 上下文生成的,用于压缩文件大小,但在 PDF 查看器上很容易查看。我搜索了任何支持解码这种 PDF 的 Java API,但没有成功。我正在寻找任何可用于解码的应用程序或 Java API;必须在 Linux 机器上可用。