Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我们正在使用 grails 2.1.1,我们想从上传的pdf文件中搜索联系电话。我们已经用 doc 文件完成了这项工作,但现在我们也想从 pdf 文件中搜索和提取联系人。有什么方法可以从 grails 中的 pdf 文件中搜索和提取文本。
你看过apache tika吗?
它应该处理这两种格式并节省您分别处理每种类型的时间