我的程序通读 PDF 并提取文本。当它到达空白页时,我收到错误"System.InvalidOperationException: Unable to handle Content of type iTextSharp.text.pdf.PdfDictionary",程序停止。
在尝试阅读之前如何检查页面是否为空白?如果我的程序确实遇到空白页,我该如何继续?
代码:
for (int i = 1; i <= reader.NumberOfPages; i++)
output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));