0

除了使用 ADO 之外,还有其他方法可以使用 VB6 从 PDF 文件中提取数据吗?我已经成功地在不使用 Acrobat Reader 的情况下使用 VB6 打开了 PDF 文件,但我项目的下一步需要读取 PDF 文件并从中查找数据。示例哪些页面显示“水泥”一词?

4

1 回答 1

1

通常,您将需要依赖外部库。一个纯 VB 解决方案(即,将文件作为文本读取并自己处理)是您在一周内完成的任何事情。

您可以通过自动化使用 Adob​​e Acrobat。例如http://www.freevbcode.com/ShowCode.asp?ID=7066可以帮助您入门。但是请注意,Adobe Reader 是不够的,您确实需要完整的 Acrobat。还有其他流行的 PDF 阅读库(例如 poppler),但是您可能很难使用 VB6 中的那些。

一般而言,您成功的机会取决于“提取”的含义。简而言之,PDF 是一种没有元信息的纯描述性格式。即该文件包含诸如“Put an A at (x1,y1); put 'foo' at (x2, y2)”等指令。读取表格或任何类型的结构化信息都需要大量的启发式方法。

最好的做法可能是尝试以更适合的数据格式(纯文本、XML 等)获取您想要提取的数据。

于 2012-05-16T13:11:59.567 回答