我正在尝试使用 Python 3 从 PDF 中提取交易数据作为一个简单的程序。我看到的是输出从第 1 页返回为垃圾文本。这发生在特定的银行对账单 pdf 上,而其他 PDF 工作正常。
import PyPDF2
pdfFileObj = open('st1.pdf','rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
pageObj = pdfReader.getPage(1)
print(pageObj.extractText())
6
ÉŁ@äKâKñ øðð
õòô õùô`øòððóøøðÅ¢Š†IŒfiñ</code>øøø
ôôö
óóðøããèñøðð
ùõõøðöð׆¨@‡¨@Š‹ŒŁ–
ñ
øððôóö
÷ùõøÖ¤£¢›—–@äKâK@…†fifi@…Œfifi–…£ñ<code>óðò
不知道其他人是否有类似的问题?或任何建议?