有谁知道在 OSX(雪豹)上运行的免费 PDF 检查器工具。
我需要以纯文本形式显示 PDF,包括它的运算符。因此,该工具应将 PDF 中的所有对象(平面编码)解码为纯文本,包括其运算符。
原因是:我试图从 iPhone 应用程序内的 PDF 中提取所有文本。我可以很好地做到这一点。但我不知道 PDF 中使用了哪些运算符。这导致提取的字符串没有任何空格,我需要知道文档中使用了哪些运算符,以便找出哪个运算符应该代表空格。
有谁知道在 OSX(雪豹)上运行的免费 PDF 检查器工具。
我需要以纯文本形式显示 PDF,包括它的运算符。因此,该工具应将 PDF 中的所有对象(平面编码)解码为纯文本,包括其运算符。
原因是:我试图从 iPhone 应用程序内的 PDF 中提取所有文本。我可以很好地做到这一点。但我不知道 PDF 中使用了哪些运算符。这导致提取的字符串没有任何空格,我需要知道文档中使用了哪些运算符,以便找出哪个运算符应该代表空格。
另一个可供您选择的工具可能是 Jay Berkenbilt 的QPDF(它是开源软件,可在所有主要操作系统平台上使用)。
引用:“QPDF 是一个命令行程序,可以对 PDF 文件进行结构性、内容保留的转换。”
要展开 中的所有流input.pdf
,请运行此命令并output.pdf
在文本编辑器中打开:
qpdf --qdf input.pdf output.pdf
尝试使用PDF Vole。它是开源的(建立在 iText 之上)并且基于 Java,因此它应该可以在 OS X 上运行。