3

我正在尝试使用PDFrw从某个 PDF 中获取数据(假设页面右上角的那个)。我正在使用 PDFrw 来执行此操作。我查看了他们提供的文档(我找不到太多)并查看了他们在 git 上发布的示例代码,但我似乎无法获得足够的信息来做我想做的事情。我将如何制作一个简单的程序来使用 PDFrw 进入 PDF(或者如果有更好的程序)并提取一段文本。我正在考虑将其转换为 html ......这会更容易吗?以我上面提供的 PDF 为例,我想获得(比方说)电压,在 PDF 中为 600 w...我将如何以最简单的方式执行此操作?我找不到任何其他关于此的堆栈溢出问题,所以希望有人可以帮助以前使用过它的人!

谢谢!

4

1 回答 1

11

我是 pdfrw 的作者,它并不是为此而设计的。你可能应该看看 pdfminer。

于 2015-07-15T14:55:53.593 回答