Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试从 pdf 文件中获取特定文本或行的字体大小或格式(粗体等),但直到现在还没有成功。
像下面这样使用 PDFTextStripper 只会得到纯文本
PDFTextStripper 剥离器 = new PDFTextStripper(); String actualText = stripper.getText(actualDoc);
你能帮我解决这个问题吗?谢谢。
您需要扩展PDFTextStripper和覆盖PDFTextStripper#processTextPosition. 此方法使您可以访问TextPosition保存字体属性的对象。然后,您需要收集位于指定框(您的行)中的所有 TextPositions 并将它们放在一起。
PDFTextStripper
PDFTextStripper#processTextPosition
TextPosition