-1

如何检测损坏的 pdf(使用 python)?

我有很多pdf。其中一些 pdf 文件已损坏,应删除。如何检测和删除?

我用了 :

 from pyPdf import PdfFileReader

try :
     mypdf = PdfFileReader(file( 'sample.pdf', 'rb'))
except:
     print ' is invalid pdf'

但是如何自动从文件中读取 pdf 并删除损坏的 pdf 呢?

4

1 回答 1

1

Adobe Reader 实际上包含许多自动修复功能,因此它会打开大量损坏的 PDF 文件。

于 2013-06-12T14:26:27.680 回答