1

我正在使用 lucene 提供对文本文件的索引和搜索。我可以使用 HDFS 来存储索引文件吗?

4

2 回答 2

2

您交换任务:与其考虑在哪里使用 Hadoop,不如先考虑实施项目需要什么。如果你发现你需要 Hadoop,那么在哪里以及如何使用它就会变得很明显。

一个提示。很可能您既不需要 Hadoop,也不需要 Lucene 本身:Solr - 在 Lucene 之上创建的搜索服务器 - 现在具有分布式设置,专为索引和搜索而设计;Nutch可以作为 Solr 爬网的前端;Tika可以帮助您解析所有类型的离线文件。

于 2013-01-10T08:14:12.273 回答
0

在所有数据都以 lucene 文档(lucene 缓存)的形式准备好之后,Lucene 就会出现。看起来你已经知道 Lucene。Hadoop 的目的是将大任务缩减为小块。我认为 Hadoop 的第一个用途可以是收集数据。每个hadoop节点都可以不断收集数据;并创建 lucene 文档

于 2013-01-10T08:10:00.347 回答