我有 2 个核心,core1和core2,我正在尝试使用多个核心来实现以下目标。
1)如何从core1(仅core1)中删除所有条目。
通常,当我只有一个核心时,我使用以下命令删除所有文档。
java -Ddata=args -Dcommit=true -jar post.jar " : "
2) 使用 Nutch,如何只在 core2 中索引 web 文档。(不在 core1 中)
问题 1:由于某种原因,我的 curl 命令给了我错误。我纠正了它,现在它工作正常。
curl localhost:8983/solr/core1/update/?commit=true -H "Content-Type: text/xml" -d "<delete><query>*:*</query></delete>
问题 2:为了使用 Nutch 将数据索引到不同的核心,我使用了以下命令,它对我有用。因此与您分享想法。
bin/nutch crawl urls -solr http://localhost:8983/solr/core1/ -depth 3 -topN 5
bin/nutch crawl urls -solr http://localhost:8983/solr/core2/ -depth 3 -topN 5
每个核心将有一个单独的 URL(参见下面的示例)。只需为您的删除和索引操作分别引用每个核心。
http://localhost:8983/solr/core1
http://localhost:8983/solr/core2
1) 对于删除,我建议使用可以通过 curl 执行的按 ID 或查询删除选项,指定 core1 的 url。
2) 要使用 Nutch 对 core2 进行索引,只需在索引步骤中为 core2 使用适当的 url。