1

Solr 索引有两个字段,我不想显示任何欺骗。我可以通过分组来防止欺骗出现在一个字段或另一个字段上,但是Solr 目前不支持在多个字段上进行分组。然而,虽然必须防止其中一个字段在完全匹配上重复,但另一个可以防止在模糊(几乎)匹配上返回重复。请注意,这些字段非常短,通常只有一两个单词。

请注意,受骗者应保留在索引中,我只需要防止受骗者出现在结果中。我会简单地在应用程序中过滤它们,但这会破坏分页。

如何在 Solr 4 中的两个字段上防止欺骗(甚至接近欺骗)?

谢谢你。

例子:

没有欺骗First Name,也没有欺骗Last Name。这些是文件:

  • 名字:约翰
  • 姓名:列侬
  • 乐队:披头士
  • 名字:约翰
  • 姓名:琼斯
  • 乐队:齐柏林飞艇
  • 名字:尼克
  • 姓名:列侬
  • 乐队:独立
  • 名字:尼克
  • 姓名:梅森
  • 乐队:平克弗洛伊德

首先,我们将返回第一个文档:

  • 名字:约翰
  • 姓名:列侬
  • 乐队:披头士

第二份文件将不会被退回,因为它是First Name现场的骗子。

第三份文件不会被退回,因为它是Last Name场上的骗子。

第四个文档不是First Name任何Last Name返回字段的副本,因此它被返回:

  • 名字:尼克
  • 姓名:梅森
  • 乐队:平克弗洛伊德

我们现在有两个文件。

4

0 回答 0