0

有很多使用该bin/nutch solrindex命令的文档和示例,但该bin/nutch elasticindex命令缺乏覆盖范围。我正在努力将 Nutch 2.2.1 的实例与 Elasticsearch 0.90.2 结合起来。我尝试使用此插件将 Elasticsearch 伪装成 Solr 实例,但任何bin/crawl作业都因内部服务器错误而崩溃。我正在寻找的是bin/crawl修改为使用 Elasticsearch 的示例或bin/nutch elasticindex命令的详细描述(nutch wiki 没有它的页面)。我可以简单地solrindexelasticindex自由替换每个出现的短语吗?

4

2 回答 2

0

我已修改bin/crawl以删除该bin/nutch solrdedup命令,并将所有提及的内容替换solrindexelasticindex.

于 2013-07-08T10:11:25.657 回答
0

我认为 Nutch 2.2.x 无法与 Elasticsearch 一起使用。但与 1.8 相比,我没有看到 2.2.x 的额外好处。唯一的问题是 Nutch 2.2.x 使用 Gora 将爬取的页面保存在您选择的数据库中。由于您使用 Elasticsearch 来索引结果,我假设您不需要数据库。我用 Elasticsearch 0.90.11 制作了 Nutch 1.8,你可以在我的 GitHub 帐户上找到该包: https ://github.com/andreivisan/NutchElasticsearch

于 2014-04-12T23:00:47.497 回答