5

是否有 python 的包/库可以让我打开 PDF,并在文本中搜索某些单词?

4

2 回答 2

12

使用PyPdf2,您可以使用extractText()方法来提取 pdf 文本并对其进行处理。

更新:更改文本以引用 PyPdf2,感谢 @Aditya Kumar 的提醒。

于 2009-11-04T07:39:34.133 回答
4

我认为您不能一步完成,但您当然可以使用pdfminer从 pdf 中获取文本。然后,您可以对恢复的数据应用任何文本搜索。

于 2009-11-04T07:38:39.010 回答