2

我正在尝试从 pdf 文件中解析文本。当我在做 PyPDF2 的教程时,我得到了以下错误。我搜索了答案,但最终没有找到答案。任何帮助将不胜感激。

Traceback (most recent call last):
  File "D:/text_recognizer/main.py", line 4, in <module>
    inputStream = PyPDF2.PdfFileReader(input)
  File "D:\KimKanna's Class\python27\lib\site-packages\PyPDF2\pdf.py", line 1084, in __init__
    self.read(stream)
  File "D:\KimKanna's Class\python27\lib\site-packages\PyPDF2\pdf.py", line 1689, in read
    stream.seek(-1, 2)
IOError: [Errno 22] Invalid argument

这是完整代码

import PyPDF2

with open(".\\pdf\\test_sample.pdf","rb") as input:
    inputStream = PyPDF2.PdfFileReader(input)
4

1 回答 1

2

在我的情况下,我想打开的 .pdf 是空的,并且没有从 powershell(cmd 提示符)中的先前 python 代码关闭。因此,当我尝试删除这些文件时,它会显示“关闭文件并重试”。(那是我的“AHaa”时刻)

所以我从 Windows 任务管理器中停止了 py.exe 并删除了那些空的、未关闭的文件。然后我用另一个文件运行相同的代码,它工作得很好.. :)

于 2018-04-03T15:11:39.203 回答