Solr 索引有两个字段,我不想显示任何欺骗。我可以通过分组来防止欺骗出现在一个字段或另一个字段上,但是Solr 目前不支持在多个字段上进行分组。然而,虽然必须防止其中一个字段在完全匹配上重复,但另一个可以防止在模糊(几乎)匹配上返回重复。请注意,这些字段非常短,通常只有一两个单词。
请注意,受骗者应保留在索引中,我只需要防止受骗者出现在结果中。我会简单地在应用程序中过滤它们,但这会破坏分页。
如何在 Solr 4 中的两个字段上防止欺骗(甚至接近欺骗)?
谢谢你。
例子:
没有欺骗First Name
,也没有欺骗Last Name
。这些是文件:
- 名字:约翰
- 姓名:列侬
- 乐队:披头士
- 名字:约翰
- 姓名:琼斯
- 乐队:齐柏林飞艇
- 名字:尼克
- 姓名:列侬
- 乐队:独立
- 名字:尼克
- 姓名:梅森
- 乐队:平克弗洛伊德
首先,我们将返回第一个文档:
- 名字:约翰
- 姓名:列侬
- 乐队:披头士
第二份文件将不会被退回,因为它是First Name
现场的骗子。
第三份文件不会被退回,因为它是Last Name
场上的骗子。
第四个文档不是First Name
任何Last Name
返回字段的副本,因此它被返回:
- 名字:尼克
- 姓名:梅森
- 乐队:平克弗洛伊德
我们现在有两个文件。