2

我正在尝试从 pdf 文件中获取特定文本或行的字体大小或格式(粗体等),但直到现在还没有成功。

像下面这样使用 PDFTextStripper 只会得到纯文本

PDFTextStripper 剥离器 = new PDFTextStripper(); String actualText = stripper.getText(actualDoc);

你能帮我解决这个问题吗?谢谢。

4

1 回答 1

0

您需要扩展PDFTextStripper和覆盖PDFTextStripper#processTextPosition. 此方法使您可以访问TextPosition保存字体属性的对象。然后,您需要收集位于指定框(您的行)中的所有 TextPositions 并将它们放在一起。

于 2014-04-02T23:47:38.733 回答