是否有 python 的包/库可以让我打开 PDF,并在文本中搜索某些单词?
问问题
7860 次
2 回答
12
使用PyPdf2,您可以使用extractText()方法来提取 pdf 文本并对其进行处理。
更新:更改文本以引用 PyPdf2,感谢 @Aditya Kumar 的提醒。
于 2009-11-04T07:39:34.133 回答
4
我认为您不能一步完成,但您当然可以使用pdfminer从 pdf 中获取文本。然后,您可以对恢复的数据应用任何文本搜索。
于 2009-11-04T07:38:39.010 回答