0

当我尝试在 Python 的一个文件夹中读取和打印多个 PDF 的内容时,我遇到了这个错误。我无法解决它。请帮我。

pdfFileObj = open(fp, 'rb') IOError: [Errno 2] No such file or directory: 'Mr praveen.pdf'

这是我的代码

import PyPDF2
import os
path = r'/root/Desktop/temp_dir'     #path of folder containing several PDFs
for fp in os.listdir(path):
  pdfFileObj = open(fp, 'rb')

  pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
  print(pdfReader.numPages)

  for i in range(0,pdfReader.getNumPages()):
  ` data+= pdfReader.getPage(i).extractText()

  print data                  #(pageObj.extractText())
  pdfFileObj.close()

谢谢

4

1 回答 1

0

问题是从返回的名称os.listdir(path)只是您拥有的os.path.join(path, fp)带有目录名称的文件名:

path = r'/root/Desktop/temp_dir'     #path of folder containing several PDFs
for fp in os.listdir(path):
    pdfFileObj = open(os.path.join(path, fp), 'rb')

要么os.chdir(path)在循环之前执行,要么在循环之前执行,但这可能会导致程序中的其他地方出现问题,因此大多数情况下处理完整路径名会更好。

于 2018-12-10T11:21:49.507 回答