0

我的程序通读 PDF 并提取文本。当它到达空白页时,我收到错误"System.InvalidOperationException: Unable to handle Content of type iTextSharp.text.pdf.PdfDictionary",程序停止。

在尝试阅读之前如何检查页面是否为空白?如果我的程序确实遇到空白页,我该如何继续?

代码:

for (int i = 1; i <= reader.NumberOfPages; i++)
     output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));
4

1 回答 1

1

像这样的东西?

for (int i = 1; i <= reader.NumberOfPages; i++)
{
    string tmp = PdfTextExtractor.GetTextFromPage(reader, i, 
                     new SimpleTextExtractionStrategy());
    if(!string.IsNullOrEmpty(tmp))
        output.WriteLine(tmp);
}
于 2012-12-20T11:12:09.737 回答