我使用 iText 5.3.3
我尝试从 pdf 文件中提取文本。
我使用类似的东西:
File f (....)
FileInputStream fis = new FileInputStream(f);
r = new PdfReader(fis);
String s=PdfTextExtractor.getTextFromPage(r, 1);
System.out.print(s);
我明白了:
“(...)新加坡航空公司面临历史上第一起致命坠机事故引发的危机(...)”
对于文本:
“(...)新加坡航空公司面临历史上第一次致命坠机事故引发的危机(...)”
或:“(...)国家运营商和最终结论表明需要(...)”
对于文本:“(...)国家运营商和最终结论表明需要(...)”
如您所见,我得到“?” 插入“fi”。