1

我刚刚开始使用 Nutch 和 Solr。我只用一个种子 URL 运行了一次爬网。我运行了这个命令:

bin/nutch crawl urls -dir crawl -solr http://localhost:8983/solr/ -depth 3 -topN 5

一切都很好,我假设 Solr 索引页面?那么我现在该如何进行搜索呢?我去了这里localhost:8983/solr/admin/但是当我输入搜索查询并单击搜索时,我得到了这个:

HTTP ERROR 400
Problem accessing /solr/select/.
Reason: undefined field text

我还尝试了教程中的一个示例,但是当我运行此命令时:

java -jar post.jar solr.xml monitor.xml

我明白了:

SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file solr.xml
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name'

我的最终目标是以某种方式将这些数据添加到 Accumulo 并将其用于搜索引擎。

4

1 回答 1

2

我假设您使用的是 Nutch 1.4 或更高版本。如果是这种情况,您需要将在 solr/conf/schema.xml 文件中添加的字段类型从“text”更改为“text_general”,不带引号。

我现在正在朝着类似的目标努力,并使用该修复程序至少让 solr 正常工作,尽管我仍然无法让 solr 搜索索引站点。希望这会有所帮助,让我知道如果你得到它的工作。

于 2012-06-21T22:17:12.403 回答