有没有人有幸为 nutch 编写自定义索引器以使用 elasticsearch 索引爬网结果?或者你知道任何已经存在的吗?
问问题
3002 次
4 回答
10
我编写了一个模拟 Solr api 的 ElasticSearch 插件。使用这个插件和标准的 Nutch Solr 索引器,您可以轻松地将抓取的数据发送到 ElasticSearch。可以在 GitHub 上找到插件以及如何将其与 Nutch 一起使用的示例:
于 2012-02-09T20:29:34.980 回答
3
我知道 Nutch 将添加可插拔的后端并且很高兴看到它。我需要将 elasticsearch 与 Nutch 1.3 集成。代码张贴在这里。捎带 (src/java/org/apache/nutch/indexer/solr) 代码。
于 2011-11-21T13:52:33.050 回答
2
还没有这样做,但这绝对是可行的,但需要搭载 SOLR 代码(src/java/org/apache/nutch/indexer/solr)并将其适应 ElasticSearch。将是一个很好的贡献 Nutch BTW
于 2011-05-25T15:22:07.037 回答
0
时间流逝,现在 Nucth 已经与 ElasticSearch 很好地集成。 这是一个很好的教程。
于 2016-01-15T09:03:15.317 回答