3

我需要编写一个可以在 PDF 文档中找到最大文本的程序(这可能是标题!),我尝试使用Tika作为解析器,但找不到获取字体大小的方法。Tika 库对于我的使用来说似乎过于强大和复杂。我可以使用更简单的方法/库吗?不使用库并自己解析 PDF 是否更容易或更好(我对这种方法有点兴趣)?如果是这样,我应该从哪里开始?

非常感谢任何信息。

4

1 回答 1

1

我在 SO 上找到了这个方法,它覆盖了PDFBox 库中的processTextPositionfromPDFTextStripper并提取了字体大小。我以前没有看到它,因为帖子的问题有点不同。

于 2012-10-25T17:02:53.080 回答