我有一个包含许多表格信息的 PDF 文件,例如
1 john maklin testing 20000
我想将此 PDF 文件数据转换为 Excel 文件。
我有一个包含许多表格信息的 PDF 文件,例如
1 john maklin testing 20000
我想将此 PDF 文件数据转换为 Excel 文件。
如果它是一次性的,那么我建议使用市场上已有的软件。我建议在 SO 中查看此链接,在那里我回答了类似的查询。
如果这是常规操作,那么您可以尝试将Xpdf集成到您的代码中以创建一个这样的应用程序。虽然我相信它会很乱:)
我本可以建议安装 Adobe Professional,然后在您的程序中使用它,但我已经走过了这条路线,我相信您也不想这样做。Adobe 已经发布了 PDF 规范,但似乎每个程序对 pdf 的解释都有些不同,考虑到每个供应商都遵循不同的指南来创建 pdf,这使得人们很难阅读任何 pdf 文件。
如果你在网上搜索,你会看到这个链接。他们声称已经成功地将 Xpdf 与 VBA 集成。我从未测试过它,因此您可能想自己检查一下。如果它可以集成到 VBA 中,那么它很有可能也可以集成到 VB.Net 中。我不确定python虽然。
另一种选择是,如果您可以直接将文件输出到 csv 而不是源处的 pdf,则不会出现 pdf 到 Excel 的转换。我不确定您是否可以行使此选项。