2

我在 Windows 机器上使用 solrcloud-4.3.0 和 zookeeper-3.4.5。我有一个具有唯一字段“id”的索引集合。我观察到索引中存在具有相同唯一 id 值的重复文档。据我了解,这不应该发生,因为独特领域的目的是避免这种情况。任何人都可以帮我解决这个问题的原因吗?

4

2 回答 2

0

在“/conf/schema.xml”文件中有一个名为“”的 XML 元素,默认情况下它似乎是“id”......这应该是你的“key”。

但是,根据 Solr 文档(http://wiki.apache.org/solr/UniqueKey#Use_cases_which_do_not_require_a_unique_key),如果您不需要将新文档增量添加到一个现有的索引......也许这就是你的情况。但我也觉得你总是需要一个唯一的 ID。

于 2013-07-10T10:13:43.190 回答
0

添加此问题的答案可能为时已晚,但也可以通过将索引与重复文档/字段合并来复制具有唯一键/字段的文档。

显然,当通过 lucene IndexMergeTool 或 solr CoreAdminHandler 合并索引时,任何重复的文档都将愉快地附加到索引中。(从 lucene 和 solr 4.6.0 开始)

重复数据删除似乎发生在检索时。

https://cwiki.apache.org/confluence/display/solr/Merging+Indexes

于 2013-12-28T00:40:08.913 回答