我想制作一个使用 PDFBox 在 pdf 中搜索单词的程序。
这是我的小程序:
List<String> words ;// List of words
PDDocument document = PDDocument.load("D:\\INIT.pdf");
PDFTextStripper s = new PDFTextStripper();
String content = s.getText(document);
Comparing(content,words);//methode for searching those words on my text
System.out.println(content);
但是是否可以在没有文本的情况下直接查看 PDF getText
?
getText
返回一个字符串。如果我们在 pdf 文件中有一个大文本,这个字符串可以承载相同的文本,当文本很大并且不受 String 支持时,是否有另一种类型用于这种情况????