2

我使用 PDFTextStripper 类在 Lucene 索引之前提取 pdf 文本。

是否有可能从提取的文本中排除 pdf 页眉和页脚?

4

1 回答 1

0

如果您知道文档中页眉和页脚的确切位置,则可以使用按区域提取文本。希望这可以帮助。

于 2013-04-06T13:28:40.750 回答