3

我正在尝试开始使用 Nutch (v 1.7) 和 Solr (v 4.3.1)。我正在关注本教程:http ://wiki.apache.org/nutch/NutchTutorial

我被第 6 步弄糊涂了,我被告知将 Nutch 模式文件复制到 Solr 的目录之一。

6. 将 Solr 与 Nutch 集成

我们已经正确安装和设置了 Nutch 和 Solr。Nutch 已经从种子 URL 中创建了抓取数据。以下是将搜索委托给 Solr 以获取可搜索链接的步骤:

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/

问题是那${APACHE_SOLR_HOME}/example/solr/conf/不存在。 /example/solr/只包含

README.txt  
bin     
collection1 
solr.xml
zoo.cfg

有谁知道如何进行?我应该创建一个./example/solr/conf目录并将 Nutch 文件复制到该目录吗?

非常感谢您的帮助。

4

3 回答 3

5

由于您使用的是 Solr 4.x,因此您将在 collection1 中拥有 conf,您应该能够执行以下操作:

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/collection1/conf/
于 2013-07-11T00:01:52.070 回答
1

我认为我的错误是在这个特定的 Nutch 教程中使用了 Solr 4.3.1 版。Solr 的早期版本,如 3.6.2,有一个conf目录,教程说它们应该在其中。我认为本教程是在考虑 v 3.6.2 的情况下编写的。

我已经切换到 Solr v. 3.6.2,现在事情运行得更顺利了。

于 2013-07-11T00:57:50.720 回答
1

我正在尝试将 Apache Nutch 1.7 与 Apache Solr 3.6.2 集成,并且在您提到的那一行之后有这一行:

Copy exactly in 351 line: 

<field name="_version_" type="long" indexed="true" stored="true"/>

现在我很困惑,因为从 Nutch 目录复制的 schema.xml 只有 124 行。在哪里粘贴该行?

谢谢!

于 2014-03-25T06:52:06.100 回答