0

我的 SOLR 文档是葡萄酒实体。当用户搜索关键字“Haut Bailly”(这是来自波尔多的葡萄酒)时,我想首先获得一个标题长度较短的匹配文档,例如:

  1. "Château Haut-Bailly - Pessac-Léognan"
  2. "Château Haut-Bailly La Parde de Haut Bailly - Pessac-Léognan"

然而,对于默认的 solr 查询,关键字“haut bailly”会返回以下排名:

  1. "Château Haut-Bailly La Parde de Haut Bailly - Pessac-Léognan"
  2. "Château Haut-Bailly - Pessac-Léognan"

有没有我可以使用的参数来增加更接近短语搜索(就长度而言)和更短字段(这里是标题)的匹配分数?所以在这里正确的葡萄酒(“Château Haut-Bailly - Pessac-Léognan”)出现在排名中?

谢谢!

4

2 回答 2

0

我认为默认评分已经可以做到这一点(如果您没有使用 omitNorms 省略规范)。第一个文档得分较高,因为它进行了两次搜索(很可能它也匹配 Haut-Bailly 或其中一个单词,具体取决于您使用的标记器/解析器)

于 2012-09-18T17:13:00.110 回答
0

使用重复过滤器可能有效 http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.RemoveDuplicatesTokenFilterFactory

于 2012-09-19T04:03:19.837 回答