0

现在我有一个项目,我需要在其中构建一个搜索引擎,但我不能使用 Solr,只有 nutch 和 lucece,虽然我在论坛中搜索,所以我发现很多人说 nutch 做索引,我安装了 nutch (1.4)和爬网数据,但意识到我没有索引文件夹或类似的东西,只有爬网数据。所以,问题是,nutch 真的索引它爬网的内容还是需要 Lucene 进行索引和搜索?

PS。对于这个项目,我不能使用 Solr,只能使用纯 nutch 和 lucene,我需要使用 Java 构建所有东西,所以当人们说 nutch 实际上索引时,我真的很困惑......对不起我的英语不好,它不是我的母语...

4

2 回答 2

0

Nutch 不会索引您的数据,它不使用 Lucene,因此它无法创建自己的索引。Nutch 必须将文档传递给 Solr 才能对其进行索引。

查看:nutch 与 solr 索引

于 2013-08-17T13:30:22.767 回答
0

Lucene 用于 Nutch 的索引和搜索。据我了解 Nutch,它将找到的页面传递给 Lucene 进行索引。

于 2013-08-16T19:13:10.770 回答