我正在尝试将此分隔的 PDF转换为 excel(或其他一些分隔格式)。使用 Adobe Acrobat 9,我尝试将其保存并复制为 Excel,但它给出了错误消息"BAD PDF; error in processing fonts. [348]"。
我对任何将创建分隔文件的解决方案持开放态度,从使用 Adobe Acrobat 到编程再到使用其他应用程序。唯一的限制是我没有购买任何东西的预算(例如 Able2Extract)。
注意:不是真正的答案,而是一些建议。
在我看来,Crystal Reports 没有足够接近 PDF 规范。
我会确保 CR 已完全更新/修补并尝试生成另一个文件,确保启用“标记” - 标记定义了布局结构。我手头没有 CR 的副本,但您可能必须定义要使用的蒸馏器模板,因此当您打印到 PDF 时,您可以选择该作业选项。
您还可以通过在 Acrobat 中使用 Preflight 来判断它的 PDF 错误,它说没有标签结构,您可以手动进行(在每个项目周围绘制框......)。另外,没有语言集,它在某种程度上与 Acrobat 1.3 兼容?哪个不再受支持,最低应该是 4?
一旦你有了一个“好”的 pdf,就可以导出到 xml/word 并将其导入到 excel 中。此外,在 Acrobat 8+ 中,您可以使用选择工具突出显示,右键单击并选择打开为电子表格。您可能只需突出显示整个文档就可以逃脱 - 尽管我希望 xml 方法是最好的。
Able2Extract 做了一些 OCRing 和棘手的模糊逻辑,不仅可以定义标签/布局,因此它是可导出的,而且还避免了任何字体、编码等问题——至少据我所知。
在您无法获取新文件的极少数情况下,导出为纯文本/可访问似乎会生成一个不错的纯文本文件。您可以编写一个 vbscript 来解析它(添加分隔符)并将其导入到 excel 中。
我能够在不购买任何额外软件进行转换的情况下导出图像和字体的方式就是这种方式。转到高级,PDG 优化器,在左栏中选择您想要的所有选项,并在其中显示与选择 Acrobat 8.0 及更高版本兼容,好的....您正在通往成功的道路上