0

我们正在使用两个 solr 来索引文件。有时一篇文章在两个 solr 中都被索引,因为我们确实更新了。由于这些重复的文章,它会导致分面计数不正确的问题。如何消除重复计数?

4

1 回答 1

0

我的建议是不要保留重复的文章。因此,您需要一种方法来识别此重复文章并将其从一个 SOLR 中删除。

如果您不想删除重复的文章,您仍然需要跟踪它们。了解 SOLR1 中的哪些文章在 SOLR2 中是重复的,将帮助您消除重复计数,如下所示:

  • 在 SOLR1 中创建一个额外的字段,名为:

    IsDuplicateField = true, if article is duplicated in SOLR2
                     = false, otherwise
    
  • 当您对 SOLR1 进行查询时,将: IsDuplicatedField=true 添加到构面。

  • 检索结果时,只需使用 SOLR1 中的 IsDuplicateField 总数减少构面计数的总数。

在这种情况下,构面 IsDuplicateField 将检索所有重复并与您的查询匹配的文章。

祝你好运 !

于 2011-08-18T09:25:04.707 回答