有很多使用该bin/nutch solrindex
命令的文档和示例,但该bin/nutch elasticindex
命令缺乏覆盖范围。我正在努力将 Nutch 2.2.1 的实例与 Elasticsearch 0.90.2 结合起来。我尝试使用此插件将 Elasticsearch 伪装成 Solr 实例,但任何bin/crawl
作业都因内部服务器错误而崩溃。我正在寻找的是bin/crawl
修改为使用 Elasticsearch 的示例或bin/nutch elasticindex
命令的详细描述(nutch wiki 没有它的页面)。我可以简单地solrindex
用elasticindex
自由替换每个出现的短语吗?
问问题
341 次
2 回答
0
我已修改bin/crawl
以删除该bin/nutch solrdedup
命令,并将所有提及的内容替换solrindex
为elasticindex
.
于 2013-07-08T10:11:25.657 回答
0
我认为 Nutch 2.2.x 无法与 Elasticsearch 一起使用。但与 1.8 相比,我没有看到 2.2.x 的额外好处。唯一的问题是 Nutch 2.2.x 使用 Gora 将爬取的页面保存在您选择的数据库中。由于您使用 Elasticsearch 来索引结果,我假设您不需要数据库。我用 Elasticsearch 0.90.11 制作了 Nutch 1.8,你可以在我的 GitHub 帐户上找到该包: https ://github.com/andreivisan/NutchElasticsearch
于 2014-04-12T23:00:47.497 回答