我正在尝试使用 Python 从 PDF 中提取文本,并且我已经使用 PyPDF2 成功地做到了这一点,如下所示:
import PyPDF2
pdfFileObj = open('path', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pageObj = pdfReader.getPage(0)
pageObj.extractText()
这会从页面中提取所有文本,但我只想从页面左上角的 3'x4' 矩形区域中提取文本。
我基本上想做类似的事情:如何从特定矩形区域内的 pdf 文档中提取文本?但在 Python 中
这可以通过 PyPDF2 或任何其他 Python 库来完成吗?