我刚刚开始使用 Nutch 和 Solr。我只用一个种子 URL 运行了一次爬网。我运行了这个命令:
bin/nutch crawl urls -dir crawl -solr http://localhost:8983/solr/ -depth 3 -topN 5
一切都很好,我假设 Solr 索引页面?那么我现在该如何进行搜索呢?我去了这里localhost:8983/solr/admin/但是当我输入搜索查询并单击搜索时,我得到了这个:
HTTP ERROR 400
Problem accessing /solr/select/.
Reason: undefined field text
我还尝试了教程中的一个示例,但是当我运行此命令时:
java -jar post.jar solr.xml monitor.xml
我明白了:
SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file solr.xml
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name'
我的最终目标是以某种方式将这些数据添加到 Accumulo 并将其用于搜索引擎。