1

在我的文档中,我有一个名为 Tag 和 SuperTag 的字段。每当标签匹配时,它都会提高一些分数,但如果在 SuperTag 上匹配,它将显着提高,使其成为第一选择。在您看来,我应该在 Tag 和 SuperTag 的 boost 字段中添加什么值?谢谢。

4

1 回答 1

1

这很难回答,这在很大程度上取决于字段包含的数据和它们拥有的分析器。

显然,如果两者的数据几乎相同,我会将 supertag 字段的提升设置为2.0.

如果他们不保存相同的数据,我们可以想象这样的场景:

{tag: 'tagnice tagnice tagnice'}

{supertag: 'tagnice'}

即使使用增强的超级标签,标签也可能更相关,因为tf-idf它给出了更高的分数。

例如,为了解决这个问题,将过滤器设置为两者的分析器将有所帮助。

如前所述,这在很大程度上取决于数据以及如何将其存储在 lucene 中。乍一看,在不知道那么多的情况下,将升压加倍是可行的。

于 2013-03-14T14:13:44.950 回答