0

Nutch 2.x 分支gora.properties文件将 Solr 列为 Nutch 的可能后端,但我在网上找不到任何文档。所以,两个问题:

  1. 我可以这样做:Nutch -> Gora -> Solr,并使用 SOLR 进行存储和索引吗?我找不到有关此特定设置的任何文档。

  2. 这样做有什么好处吗:Nutch -> Gora -> HBase -> Solr,其中 Solr 仅用于索引 HBase。这似乎是最常见的方法,但如果主要目标是使用 Solr 使用结果,则 HBase 似乎没有必要。

这是 2.x gora.properties

############################
# SolrStore properties     #
############################
#gora.datastore.default=org.apache.gora.solr.store.SolrStore
#gora.solrstore.solr.url=http://localhost:9876/solr
#gora.solrstore.solr.config=solrconfig.xml
#gora.solrstore.solr.schema=gora-solr-schema.xml
#gora.solrstore.solr.batchSize=100
#gora.solrstore.solr.solrjserver=http
#gora.solrstore.solr.commitWithin=1000
#gora.solrstore.solr.resultsSize=100
4

0 回答 0