3

我有 1000 和 1000 篇 PDF 文章,我只需要从中提取作者姓名和他的相关详细信息,例如addressPDFemail ID中提供的内容(我的意思是里面的内容)。我不想通过获取与 PDF 元数据相关的详细信息来做到这一点。因为我尝试过,我最终只得到了更少的细节,比如作者姓名、标题和其他一些我根本不需要的常用细节。

我已经通过了互联网上的所有 API,但我仍然得到了解决方案。我需要用Java来做。

4

1 回答 1

1

我认为您无法直接从任何库中获取它。使用 iTest 库阅读pdf。一旦您能够阅读文本,就可以使用正则表达式找到作者。

于 2012-05-26T13:53:28.950 回答