0

我正在构建一个搜索引擎,需要爬网、索引它并能够搜索数据。

我可以单独使用 Apache Solr 还是首先需要 Nutch 来爬网?

4

2 回答 2

3

您需要一个爬虫来收集内容,以便 Solr 可以对其进行索引。NutchCrawl Anywhere与 Solr 配合得很好。

于 2013-07-20T11:07:45.193 回答
1

Solr 是索引器,Nutch 是 Crawler!他们不能做彼此的工作!如果你想要一个搜索引擎,你必须有一个爬虫和一个索引器!您可以更改它们,甚至可以为此创建自己的应用程序!

于 2013-07-20T13:21:39.270 回答