在使用 PdfTextExtractor.GetTextFromPage 时,我将文本提取到文本文档中,但是每个尾行之后的所有空格都丢失了。我试图用一个从 MS word 创建的简单的三行 PDF 文件来复制这个问题,但没有成功,每个 endline 都被一个额外的空格替换。
下面是PDF文件的PrtScn
下面是记事本显示的文字
February 04, 2013Patient: Ima . TestD.O.B.: 6/14/1970Chart #: 2004-00001SSN: 555-55-5555Dr. :Enclosed you will find the report for Ima . Test.
以同一行结尾的单词没有与从下一行开始的单词分开。当我想解析字符串时,我认为这会导致问题。