我尝试从大型 pdf 中提取文本,但我只得到第一页,我需要将所有文本传递给字符串变量。
这是代码
public class ParsePDF {
public static void main(String args[]) throws Exception {
try {
File file = new File("C:/vlarge.pdf");
String content = new Tika().parseToString(file);
System.out.println("The Content: " + content);
}
catch (Exception e) {
e.printStackTrace();
}
}
}