17

我知道如何使用 .usinf PDFBox 读取整个 pdf 文件的文本PDFTextStripper.getText(PDDocument)

我还有一个关于如何使用PDDocumentCatalog.getAllPages().get(i).

如何使用 PDFBox 获取仅一页的文本,因为我在PDPage课堂上看不到任何此类方法?

4

1 回答 1

32

您可以在 上设置参数PDFTextStripper以读取特定页面:

PDDocument doc; // document
int i; // page no.

PDFTextStripper reader = new PDFTextStripper();
reader.setStartPage(i);
reader.setEndPage(i);
String pageText = reader.getText(doc);

据我所知,PDPage更多用于在屏幕上表示页面,而不是提取文本。因此,我不建议使用它来提取文本。

于 2013-03-28T18:44:07.013 回答