4

我必须使用 apache nutch 设计一个基于 Java/Java EE 的搜索引擎。我在互联网上进行了搜索,发现了许多关于安装 apache nutch 的文章,但找不到任何涉及 java 程序以访问或控制 apache nutch 进行爬网的文章/教程。

4

2 回答 2

1

Apache Nutch 只会帮助您抓取数据,但您需要将它找到的内容索引到搜索服务器中。这就是 Apache Solr 的用武之地。然后您可以编写 Java 应用程序以使用SolrJ与 Solr 进行交互。

有关 Nutch 和 Solr 的哪些版本可以最好地协同工作,请参阅此线程

于 2013-06-14T14:11:53.557 回答
-3

Nutch 将是您进行爬行的后端。然后您将使用 solr 索引,然后您的前端将搜索此 solr 索引。在此处查看此链接http://www.building-blocks.com/thinking/building-a-search-engine-with-nutch-and-solr-in-10-minutes

于 2013-06-14T06:52:13.533 回答