0

我有一个关于(86 个单词)的单词列表和一些 PDF 文件。我想把那些词搜索成PDF文件,返回值告诉我是否存在。

在研究教程中的解决方案时,我遇到了两个问题:

  1. 是我被迫将pdf文件转换为文件吗?

  2. 什么是让我意识到我的问题的简单的 bibilotheque,因为我真的坚持它有很多例子(pdfbox,Appach Lucense,iText,pdftron ....)

4

1 回答 1

2

是我被迫将pdf文件转换为文件

PDF文件是一个文件。因此,您不必转换它。你必须能够阅读它。您可以使用一种可用的 java PDF 解析器(例如您提到的 pdfbox)。

什么是让我意识到我的问题的简单书目...

只要您只有 86 个单词和一个文档,您可能不需要像 Lucene 这样的索引工具。但是,如果您想构建支持不同目标和不同文档的应用程序(特别是如果您需要真正的自由文本搜索),您可能需要 Lucene(或 Solr)首先对您的文档执行索引,然后使用索引执行搜索。

于 2013-05-13T09:32:15.143 回答